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统计 学 是 一 门 研究 总 体现 象 定量 认识 方法 的 科学 ， 其 目的 在 于 探索 客观 现象 内 在 的 数量 规 
律 性 ， 从 而 认识 客观 事物 内 在 的 质 的 规律 性 。 统 计 学 是 在 统计 工作 实践 的 基础 上 产生 的 ， 一 经 
形成 ,又 对 统计 工作 中 的 统计 数据 、 资 料 的 搜集 、 整 理 、 分 析 等 起 理论 指导 作用 ,并且 得 到 不 
断 的 丰富 和 发 展 。 
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生活 中 的 统计 


统计 是 什么 ? 我 们 接触 过 吗 ? 提起 统计 大 家 会 想到 什么 ? 下 面 我 们 列举 两 个 统计 学 应 用 的 实例 。 
实例 一 : 据 国家 统计 局 2016 年 5 月 报道 ，2015 年 全 国 城镇 非 私营 单位 就 业 人 员 年 平均 工资 为 62029 
与 2014 年 的 56360 元 相 比 ， 增 加 了 5669 元 ， 同 比 名 义 增 长 10. 1%， 增 速 比 2014 年 加 快 0. 6 个 百 分 
其 中 ,在 岗 职 工 年 平均 工资 63241 元 ， 同 比 名 义 增 长 10.3%， 增 速 加 快 0. 8 个 百分点 。 扣 除 物价 因 
，2015 年 全 国 城镇 非 私营 单位 就 业 人 员 年 平均 工资 实际 增长 8.5%。 图 1. 1 为 2000 一 2015 年 全 国 城镇 
非 私营 单位 就 业 人 员 年 平均 工资 增长 情况 。 


蕉 水 铂 让 


on-anlst 丰 EL、 (%) 
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(元 ) 
70000 





年 从 2006 2001 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 
} EE 绝对 值 义 增 速 
de 和 全国 人 和 世 位 吉 业 人 员 生 开光 才 避 

请 大 家 思考 :调查 的 测评 结果 是 如 何 得 出 的 ? 说 明了 什么 问题 ? 
实例 二 在 生活 中 ,我 们 经 常会 接触 到 各 种 统计 数据 ， 下 面 就 是 统计 研究 得 到 的 一 些 结论 : 吸烟 对 

健康 是 有 害 的 ; 不 结婚 的 男性 会 早 逝 10 年 ; 身材 高 的 父亲 ， 其 子女 的 身材 也 较 高 ; 第 二 个 出 生 的 子女 没 

有 第 一 个 聪明 ， 第 三 个 出 生 的 子女 没有 第 二 个 聪明 ， 依 此 类 推 ! 两 天 服 一 片 阿司匹林 会 减少 心脏 病 第 二 

次 的 发 作 概率 ; 如 果 每 天 摄取 500mL 维生素 C， 生 命 可 延长 6 年 ; 统计 调查 表明 ， 怕 老婆 的 丈夫 得 心脏 

病 的 概率 较 大 ; 学 生 们 在 听 了 黄 扎 特 钢琴 曲 10min 后 的 推力 测试 会 比 他 们 听 10min 娱乐 磁带 或 其 他 曲目 

做 得 更 好 。 

请 问 ， 你 认为 这 些 结论 是 正确 的 吗 ? 你 相信 这 些 结论 吗 ? 
资料 来 源 : 国家 统计 局 网 站 http: //www. stats. gov. cn. 








如 果 大 家 想 回答 上 面 的 一 系列 问题 并 且 正 确 阅 读 、 理 解 统计 数据 ， 进 而 解释 社会 生活 
的 现象 ， 就 必须 具备 统计 学 知识 。 理 解 和 掌握 一 些 统计 学 知识 对 普通 大 众 是 有 必要 的 。 每 
天 我 们 都 会 关心 生活 中 的 一 些 事情 .其 中 就 包括 统计 知识 。 例 如 ， 在 外 出 旅游 时 ， 需 要 关 
心 一 段 时 间 内 的 详细 天 气 预报 ; 在 投资 股票 时 ， 需 要 了 解 股票 市 场 价格 的 信息 ， 了 解 某 只 
特定 股票 的 有 关 财 务 信息 ; 在 观看 世界 杯 足球 赛 时 ， 了 解 各 支 球 队 的 技术 统计 ， 等 等 。 统 
计 已 经 渗透 到 社会 经 济 活动 和 科学 研究 的 方方面面 ， 统 计 无 处 不 在 ， 并且 正在 发 挥 越 来 越 
重要 的 作用 。 统 计 是 人 们 认识 社会 很 重要 的 一 个 工具 。 























第 1 章 

统计 学 与 统计 数据 

本 章 将 介绍 统计 学 中 的 基本 概念 和 问题 ， 目 的 是 帮助 大 家 理解 统计 学 、 熟 悉 统 计 语 
言 ， 为 学 习 以 后 各 章 的 内 容 竟 定 基础 。 


1.1 统计 学 的 基本 原理 与 内 容 


1.1.1 统计 与 统计 学 


在 日 常生 活 中 ,我 们 经 常会 接触 到 “统计 ”这 一 术语 ,在 有 关 媒 体 中 也 经 常会 看 见 一 
些 报 道 使 Rom 直播 
篮球 比赛 时 电视 机 屏幕 上 不 时 会 出 现 球 队 的 技术 统计 数据 ;对 某 城市 的 综合 竞争 力 进 行 分 
析 和 评价 研究 ， 则 要 构造 影响 该 城市 的 综合 竞争 力 的 指标 体系 ， 济 镍 集 相关 统计 数据 来 进 
行 研究 。 可 以 这 样 说 ， 统 计 已 经 渗透 到 日 常生 活 、 SR ne 
统计 无 处 不 在 ， 并 且 正 在 发 挥 越 来 越 重要 的 作用 。 SN、 
































Ka 
(SS> 阅读 专 栏 1-1 NS 
KR> [基准 共 【拓展 知识 】 
市 国 的 早期 统计 


随 着 人 类 文明 的 出 现 ， NS 部 落 中 ， he 闪闪 、 分 配 实物 时 ， 就 有 了 
ak 孕 志 着 统计 的 部 荣 f 在 古代 奴 永 社会 ， WT 征兵 、 赋税 的 需要 ， 就 有 了 关于 土地 、 

、 粮 食 和 竹 训 等 世 本 国 义 面 的 登记 、 计 量 工作 .Ar 以 一 

te 统计 已 初 具 规模 。 据 全 有 我 国 早 在 公元 前 两 千 多 年 以 前 ， 在 国家 所 
进行 的 天 文 现 测 和 居民 从 洛 条 件 的 调查 中 ， 在 艺 家 建立 的 贡 冉 制度 和 劳役 制度 里 ， 就 开始 有 调查 地 点 、 
时 间 、 人 口 、 土 闻 各 贡 研 标准 的 记载 ， 分 中 国 为 大 州 土地 2438 万 项， 人 口 1355 万 等 。 据 《 商 看 蔬 》 
载 ， 我 国 至 公元 前 300 多 年 ， 在 商 团 的 调查 研究 思想 中 ， 已 有 了 全 国 规模 的 人 口 调查 登记 制度 和 人 口 的 
年 龄 、 职 业 分 组 ， 并 且 有 了 国民 经 济 调查 研究 中 的 各 种 数量 对 比分 析 ， 把 掌握 反映 基本 国情 、 国 力 的 
“十 三 数 ” 定 为 富国 强 兵 的 重要 手段 。 

我 国 最 早 的 统计 局 设置 于 1906 年 ， 当 时 的 统计 局 分 设 三 股 ， 分 别 掌握 文化 、 民 政 、 财 政 、 教 育 、 军 
政 、 司 法 、 交 通 和 实力 统计 工作 。 

资料 来 源 ; 刘 人 竹林 ， 江 永 红 . 统计 学 : 原理 、 方 法 与 应 用 [M] . 北京 中 国 科学 技术 大 学 出 版 
社 ，2008. 

1. 统计 的 含义 


“统计 ”作为 一 种 社会 实践 活动 已 有 悠久 的 历史 。 据 历史 记载 ， 我国 在 西周 时 期 就 已 
经 建立 了 统计 制度 。 在 英文 中 ,统计 为 statistics， 它 与 “国家 ”为 同一 词根 。 可 以 说 ， 自 
从 有 了 国家 ， 就 有 了 统计 活动 。 最 初 的 统计 活动 是 为 统治 者 管理 国家 的 需要 而 进行 的 搜集 
资料 的 工作 ， 涉 及 计算 国家 的 人 力 、 物 力 和 财力 等 活动 。 随 着 社会 经 济 和 科技 的 发 展 及 统 
计 学 自身 的 进步 ， 统 计 的 应 用 领域 不 断 扩大 。 现 在 ， 统 计 不 仅 被 用 于 经 济 管理 领域 ， 而 且 
在 其 他 许多 领域 也 得 到 广泛 应 用 。 

那么 ， 究 竟 何 为 统计 ? 这 里 有 必要 给 出 一 个 比较 准确 的 科学 定义 。 所 谓 统 计 〈Statistics)， 
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就 是 人 们 认识 客观 世界 总 体 数量 变动 关系 和 变动 规律 的 活动 的 总 称 ， 是 人 们 认识 客观 世界 
的 一 种 有 力 工 具 。 统 计 主 要 有 以 下 3 方面 的 含义 

1) 统计 工作 

统计 工作 (Statistical Work) 即 统计 实践 ， 是 对 社会 经 济 现象 客观 存在 的 现实 数量 方 
面 进行 搜集 、 整 理 和 分 析 的 活动 过 程 ， 属 于 统计 中 最 基础 的 工作 。 统 计 工 作 全 过 程 分 为 4 
个 阶段 : 

(1) 统计 设计 。 统 计 设 计 是 指 根据 研究 对 象 、 内 容 和 目的 对 整个 统计 过 程 的 各 个 方面 
和 各 个 环节 进行 通盘 考虑 和 安排 ， 同 时 提出 收集 、 整 理 和 分 析 数 据 的 方案 和 工作 进度 等 。 
统计 设计 的 主要 内 容 是 指标 设计 。 统 计 的 目的 是 反映 总 体 的 数量 特征 ， 因 此 设计 相应 的 指 
标 来 反映 总 体 的 数量 特征 是 首要 的 任务 ， 否则 下 面 的 工作 无 从 做 起 。 统计 设计 是 整个 统计 
ee ee de 

(2) 统计 调查 。 经 过 统计 设计 形成 方案 之 后 ， CR 搜集 数据 。 
调查 是 在 社会 经 人 A 济 的 发 展 ， 调 查 在 经 济 活 

ZN 














动 中 所 起 的 作用 越 来 越 大 ， 企 业 的 经 营 、 不 开 来 自 调查 的 第 一 手数 据 。 
如 何 科学 地 进行 调查 是 统计 学 研究 的 重要 内 容 。 

(3) 统计 整理 。 原 始 的 统计 数据 收集 后 Wi 加 工 才能 发 挥 其 作用 。 统 计 
符 理 就 是 对 所 收 条 到 的 数据 站 料 进 行 志 坟 en 使 之 科学 化 、 系 统 化 、 条 理化 ， 并 且 可 
以 用 各 种 统计 图 表 表 示 整 理 后 的 Ne Nasa at 这 是 一 种 重要 的 
统计 方法 。 

(4) 统计 分 析 。 i i gin 
统计 分 析 的 主要 内 容 是 统计 分 析 报 告 ， 统 计 人 te en 
于 统计 人 员 对 实际 问题 的 甸 分 运用 能 力 ， 而 且 更 重 
要 的 还 取决 于 具备 天 量 的 相关 知识 ， 如 国家 政治 、 经 济 、 法 律 等 。 


网 遇 国人 博 精 乓 on 


统计 工作 4 个 阶段 的 关系 

统计 设计 是 统计 调查 的 前 提 ; 而 统计 调查 是 统计 的 基础 工作 ， 没 有 调查 就 没有 以 后 的 整理 与 分 析 ; 
dn 人 为 以 后 的 统计 分 析 做 准备 ; 
步 。 分 析 结 果 可 以 作为 决策 的 参考 

























QS 阅读 专栏 (一 2 


统计 的 职能 和 作用 


随 着 社会 主义 市 场 经 济 体制 的 逐步 建立 和 完善 ， 统 计 职能 越 来 越 重 要 。 统 计 已 由 单纯 的 统计 信息 搜 
集 整 理 职 能 转变 为 信息 、 咨 询 、 监 督 三 大 职能 。 统 计 部 门 已 成 为 社会 经 济 信息 的 主体 部 门 和 国民 经 济 核 
算 的 中 心 ， 成 为 国家 重要 的 咨询 和 监督 机 构 

信息 职能 是 指 系统 地 搜集 、 蓝 理 、 储 存 和 提供 大 量 的 以 数量 描述 为 基本 特征 的 社会 经 济 信 息 资源 。 
咨询 职能 是 利用 已 掌握 的 丰富 的 信息 资源 ， 运 用 科学 方法 进行 综合 分 析 ， 为 科学 决策 和 管理 提供 情况 和 
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咨询 建议 。 监 督 职能 是 利用 统计 信息 ， 对 社会 经 济 的 运行 状态 进行 定量 检查 、 监 测 和 预警 ， 揭 示 社 会 经 
济 运行 中 出 现 的 偏差 ， 提出 矫正 意见 ， 预 警 可 能 出 现 的 问题 ， 提 出 对 策 ， 以 促使 社会 经 济 持续 、 健 康 的 
发 展 。 
信息 、 咨 询 、 监 督 三 大 职能 是 相互 作用 、 相 辅 相 成 的 ,共同 构成 了 统计 的 整体 功能 。 其 中 ,信息 职 
能 是 最 基本 的 ， 咨询、 监督 职能 是 统计 信息 职能 的 延续 。 发 挥 统计 整体 功能 是 我 国 的 长 期 统计 工作 ， 特 
别 是 改革 开放 以 来 统计 实践 经 验 的 总 结 ， 是 国家 科学 管理 和 宏观 调控 的 客观 需要 。 
统计 的 作用 主要 体现 在 信息 、 咨 询 、 监 督 三 大 职能 上 。 具 体 表现 为 : 四 为 党 和 政府 各 贡品 回 
级 领导 机 构 决 策 和 宏观 调控 提供 资料 ; 加 为 企业 、 事 业 单位 经 营 管理 提供 依据 ; 回 为 社会 
公众 了 解 情况 ， 参 与 社会 经 济 活动 提供 资料 ; @@@ 为 科学 研究 提供 资料 ; @@ 为 国际 交往 提供 
回 
资料 。 
资料 来 源 ， 天津 市 滨海 新 区 人 民政 府 http: //www. bh. gov. cn/. 


2) 统计 数据 人 险 
统计 数据 (Statistical Data) 即 统计 资料 ， Ce 统计 数 。 国 康 总 回 


【拓展 知识 】 


据 的 搜集 是 取得 统计 数据 的 过 程 ， 是 进行 统计 分 析 的 基础 ”网 开 了 统计 数 。 计 
据 ， 统 计 方法 就 失去 了 用 武之 地 ， 加 各 类 统计 和 人 和 有 区 月 度 、 季 庆 [Dt 
者 年 度 的 经 济 发 展 情况 的 数据 等 。 NA 【拓展 视频 】 


统计 工作 有 统计 数据 的 关 系 二 过 和 和 者 关 素 ， 即 统计 数据 是 统计 工作 提供 的 ， 是 
统计 活动 的 成 果 。 RN 

3) 统计 学 Se 

统计 学 Statistics) 是 一 ! 证 计数 据 的 科学 。 世 是 钙 究 如 何 搜集 、 整 理 数据 和 进 
行 数量 分 析 、 推 断 的 一 门 方 活 论 科学 ， 是 统计 工作 让 的 结 和 概括 。 

统计 工作 和 统计 学 是 实践 和 理论 的 关系 。 ut 来 源 于 统计 实践 ， 它 是 统计 工作 经 
验 的 总 结 和 概括 .记过 米 ， 统 计 理论 又 是 指导 统计 开 作 的 原则 和 方法 。 

之， 、 统 计数 据 和 统 评 学 三 者 之 中 ， 统 计数 据 是 统计 工作 的 成 果 ， 统 
计 工作 的 水 平和 适量 又 直接 影响 统计 数据 的 质量 和 效用 。 统计 学 和 统计 工作 是 理论 和 实 
践 的 关系 ， 即 统计 学 是 在 不 断 对 统计 工作 的 经 验 基础 加 以 总 结 ， 从 而 达到 统计 学 科 的 
发 展 。 

2. 统计 学 的 含义 

虽然 人 类 统计 的 实践 活动 可 以 追溯 到 相当 遥远 的 古代 ,但 是 ， 将 统计 实践 上 升 到 理论 
并 加 以 总 结 和 概括 ， 使 之 成 为 一 门 科学 一 一 统计 学 ， 距 今 却 只 有 300 多 年 的 历史 。 综 观 统 
学 的 发 展 历史 ， 我 们 可 以 发 现 . 统计 学 最 初 是 从 设置 指标 研究 社会 经 济 现象 的 数量 开始 
的 。 随 着 社会 的 发 展 ， 为 了 适应 实践 的 需要 ， 统 计 方 法 和 理论 不 断 丰 富 和 完善 ， 统 计 学 也 
在 不 断 发 展 和 演变 。 从 当前 世界 各 国 的 状况 来 看 ， 统 计 学 已 经 成 为 研究 社会 经 济 现象 和 自 
然 现象 数量 方面 的 有 力 工具 ， 它 既 研 究 确定 现象 的 数量 方面 ， 也 研究 随机 现象 的 数量 方 
面 。 统计 学 的 作用 与 功能 从 描述 事物 现状 、 反 喘 事物 规律 ， 向 进行 抽样 推断 、 预 测 未 来 变 
化 的 方向 扩张 ， 统 计 学 自身 也 从 单一 的 实质 性 社会 科学 演变 成 横 跨 社会 科学 领域 和 自然 科 
学 领域 的 多 科 性 的 方法 论 科学 。 

1) 统计 学 的 定义 

统计 学 是 一 门 收集 、 整 理 、 分 析 和 解释 统计 数据 的 方法 科学 ， 其 目的 是 探索 数据 的 内 
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在 数量 规律 性 ， 以 达到 对 客观 事物 的 科学 认识 。 也 可 以 这 样 说 ,统计 学 是 关于 数据 的 科 
学 ， 其 内 容 包 括 数据 的 收集 、 分 类 、 汇 总 、 组 织 、 分 析 、 推 断 和 解释 。 

统计 学 的 定义 告诉 我 们 ， 统 计 离 不 开 数据 。 统 计 研 究 的 过 程 首先 要 有 数据 ， 在 拿 到 数 
据 后 ， 为 满足 分 析 的 需要 ， 还 要 对 数据 进行 一 定 的 整理 ， 而 后 再 对 数据 进行 分 析 和 解释 。 
图 1. 2 所 示 为 统计 研究 的 过 程 描述 。 


图 1.2 统计 研究 的 过 程 


























2) 统计 学 的 分 类 

根据 统计 学 的 方法 的 构成 ， 可 以 将 统计 学 分 为 描述 统计 学 ee 

(1) 描述 统计 学 (Descriptive Statistics)。 描述 统计 学 et 何 取得 反映 客观 现象 的 
数据 ,并 以 图 表 的 形式 对 所 收集 的 数据 进行 加 工 处 理 by 进而 通过 综合 、 概 括 与 分 
析 ， 得 出 反映 客观 现象 的 规律 性 特征 。 其 内 容 主要 包 据 的 收集 方法 、 数 据 的 加 工 
处 理 方法 、 数 据 的 显示 方法 、 下 扫 分布 5 的 方法 等 ， 如 使 用 曲线 图 、 饼 图 、 
条 形 图 、 表 格 等 。 tb ne 下 

(2) 推断 统计 学 (Inferential Statistt 断 统计 学 人 
推断 总 体 的 特征 ， Lene 属于 较 高 级 的 统计 学 。 在 有 些 
情况 下 ， 人 们 获得 的 统计 资料 并 非 绪 4 物 整体 的 状况 ， 而 是 米 自 事物 的 一 一 个 局 部 。 在 名 推 
断 具 有 一 一 定 的 有 效 性 和 可 夺 性 的 前 提 下 。 en 即 是 推 
断 统计 学 所 要 研究 的 内 容 。 0 稿 计 、 假 设 检 验 、 方 差分 析 、 回 归 
分 析 及 多 元 统计 分 析 等 。 

描述 统计 党 不 加 深入 一 有 二 交合 oh 而 推断 统计 学 则 在 
样本 数据 的 基 采 和 一步 地 分 析 、 研究 和 有 推断， 以 推 知 资料 本 身 以 外 的 情况 和 数量 关 
系 ; 描述 统计 学 几 的 是 总 体 数据 ， 而 推断 统计 学 则 往往 用 样本 数据 。 在 现实 问题 中 ， 我 们 
得 到 的 数据 主要 是 样本 数据 ， 因 此 ， 推 断 统 计 学 越 来 越 重要 ， 是 统计 学 的 核心 内 容 。 统 计 
学 的 发 展 过 程 中 ， 先 有 描述 统计 学 ， 后 有 推断 统计 学 ， 从 描述 统计 学 发 展 到 推断 统计 学 ， 
是 统计 学 发 展 成 熟 的 标志 。 


您 阅读 案例 1-1 




















描述 性 统计 学 的 简单 应 用 


描述 统计 学 是 用 来 描绘 或 总 结 观察 量 的 基本 情况 的 统计 总 称 。 描 述 统计 学 研究 如 何 取 得 反映 客观 现 
象 的 数据 ， 并 通过 图 表 形 式 对 所 收集 的 数据 进行 加 工 处 理 和 显示 ， 进 而 通过 综合 概括 与 分 析 得 出 反映 客 
观 现象 的 规律 性 数量 特征 。 

通过 对 数据 资料 进行 图 像 化 处 理 ， 可 将 资料 摘要 变 为 图 表 ， 以 直观 了 解 整体 资料 分 布 的 情况 ， 通 党 
会 使 用 的 工具 是 频数 分 布 表 与 图 示 法 。 通 过 分 析 数 据 资料 ， 可 以 了 解 各 变量 内 的 观察 值 的 集中 与 分 散 情 
况 , 运用 的 工具 有 集中 趋势 与 离散 程度 。 表 1-1 列 出 了 22 名 大 学 生 的 姓名 、 主 修 专业 和 年 只。 
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表 1-1 学 生 基本 情况 统计 表 





















































姓 名 主 修 专 业 年 龄 姓 名 主 修 专业 年 龄 
Richard 教育 学 19 Elizabeth 历史 19 
Sara 心理 学 18 Bil 护理 学 20 
Andrea 心理 学 19 Hadley 心理 学 19 
Steven 地 理 19 Buffy 心理 学 19 
Jordan 教育 学 20 Chip 心理 学 18 
Pam 心理 学 19 Homer 教育 学 19 
Michael 教育 学 21 Margaret 心理 学 19 
Liz 心理 学 19 Courtney Ke 17 
Nicole 心理 学 21 Leonard / i 语 19 
Mike 化 学 19 Jeffxey NS a 22 
Kent 历史 23 所 心理 学 19 





如 果 需 要 描述 22 名 学 生 中 最 流行 的 专业 ， > 在 这 
个 例子 中 最 受 欢迎 的 专业 是 心理 学 ， 外 专业 的 欠 理学 。 如 果 你 想 知道 学 生 的 平均 年 龄 ， 可 以 计算 
另 一 个 描述 统计 值 均值 RE Ce 学 生 的 平均 年 龄 为 22 岁 。 

资料 来 源 : [ 美 ] 尼 尔 。J. 疾 姑 全 优 》 i ee 2 玲玲 译 . 重庆 ， 重庆 大 学 出 版 
社 ，2011. 4 ba 

此 外 ， 根 据 统计 学 的 学 笠 分类， 人 :和 应 用 统计 学 。 

Q) 理论 统计 学 SCTheoretical StatistiaSJ。 通论 统计 学 是 指 统计 学 的 基本 原理 ， 主 要 
研究 统计 学 Se 尤其 是 各 种 统计 方法 的 数学 理论 问题 。 

(2) 应 用 统计 学 (Applied Statistics)。 应 用 统计 学 是 研究 如 何 应 用 统计 方法 去 解决 实 
际 问题 的 ， 应 用 统计 学 一 般 都 与 特定 的 领域 相 联系 。 例 如 ,统计 学 在 教育 领域 的 应 用 称 为 
教育 统计 学 ， 在 经 济 领域 的 应 用 称 为 经 济 统计 学 ， 等 等 。 

3) 统计 学 研究 的 对 象 的 特点 

(1) 数量 性 。 统 计 最 基本 的 特点 就 是 以 数字 为 语言 ， 用 数字 说 话 。 具 体 来 说 ， 就 是 用 
规模 、 水 平 、 速 度 、 结 构 和 比例 关系 等 ， 去 描述 和 分 析 客观 事物 的 数量 表现 、 数 量 关系 和 
数量 变化 ， 揭 示 事 物 的 本 质 ， 反 映 事物 发 展 规律 ， 推 断 事物 发 展 前 景 。 

(2) 具体 人 性。 统计 所 研究 的 量 不 是 抽象 的 量 ， 而 是 与 客观 事物 的 质 密切 相 联系 的 量 ， 
是 体现 事物 相互 关系 和 发 展 变化 的 量 ， 具 有 明显 的 时 空 特点 和 事物 属性 的 特点 .这 一 点 是 
统计 学 与 数学 最 本 质 的 区 别 。 因 此 具体 性 是 指 除数 字 外 ， 还 要 有 说 明 该 数字 的 所 表示 的 内 
容 、 所 指 的 时 间 (或 时 点 ) 、 所 指 的 空间 及 计量 单位 和 计算 方法 ， 这 就 是 后 面 要 讲 的 统计 
指标 的 构成 要 素 。 只 有 这 样 统计 的 数字 才 有 意义 。 

(3) 综合 性 。 作 为 认识 客观 事物 的 统计 ， 是 从 总 体 上 来 认识 其 数量 特征 ， 它 虽然 也 研 
究 个 体 ， 但 是 其 目的 是 通过 个 体 来 推断 总 体 。 在 实际 中 ,综合 性 体现 为 要 把 研究 对 象 作为 

一 个 整体 来 描述 ， 揭 示 或 推断 它 的 数量 特征 。 
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镀 阅读 专栏 1 -3 


“统计 学 ”在 国内 外 的 研究 现状 及 发 展 趋势 分 析 


1. 近代 统计 学 的 主要 贡献 

近代 统计 学 的 主要 贡献 是 建设 和 完善 统计 学 的 理论 体系 ， 并 和 逐渐 形成 了 以 随机 现象 的 推断 统计 为 主 
要 内 容 的 数理 统计 学 和 以 传统 的 政治 经 济 现象 描述 为 主要 内 容 的 社会 统计 学 两 大 学 派 。 

1) 数理 统计 学 派 

19 世纪 前 半 叶 ， 资 本 主义 制度 在 欧洲 许多 国家 中 已 经 成 熟 ， 机 械 唯物 论 的 世界 观 和 自然 科学 的 成 
果 ， 已 否定 了 所 谓 的 神 的 秩序 ,证实 了 世界 存在 自然 规律 ， 这 为 数理 统计 的 建立 创造 了 充分 条 件 。 比 利 
时 的 凯特 勒 博士 (Lambert Adolphe Jacques Quetelet，1796 一 1874) 认为 概率 论 是 适 于 政治 及 道德 科学 中 
以 观察 与 计数 为 基础 的 方法 。 prt nt neg 察 ， 并 认为 要 促进 科学 
的 发 展 ， 就 必须 更 多 地 应 用 数学 。 他 的 统计 学 著作 有 56 种 之 多 人 
成 者 ， 近 代 统 计 学 的 先驱 ， 也 是 数理 统计 学 派 的 葛 基 人 ; 同 第 一 届 国际 统计 会 议 (1853 年 
的 招集 人 ， 因此， 他 被 称 之 为 “近代 统计 学 之 父 ”。 人 

2) 社会 统计 学 派 

社会 统计 学 派 产生 于 19 世纪 后 半 叶 的 德国 。 Cs 所 以 为 之 服务 的 社会 统计 
学 派 ， 较 英国 的 政治 算术 学 派 晚 了 近 半 个 世 ht ph 社会 统计 学 派 便 
在 欧洲 大 陆 占 有 优势 地 位 ， 并 向 世界 各 国 该 学 派 的 创始 人 是 克 尼斯 K, G. A, Knies，1821 一 
1898)， 他 认为 统计 学 是 一 门 独立 的 具有 让 术 内 容 的 社会 科学 必 强 一 位 有 影响 的 创始 人 是 乔治 
ei 福 会 科学 。 

2. 现代 统计 学 的 发 展 时 期 "(20 世纪 初 到 现在 ) 

1) 欧美 数理 统计 学 ~ 一 

自 19 世纪 末 以 来 《 同 洲 自然 科学 飞跃 发 展 a 进化 论 和 能 量 守 衡 定律 的 出 
现 促进 了 描述 统计 的 完 大 ， 是 招 壕 统计 学 水 发 大作 。 20 世纪 20 年 代 以 后 ， 在 细胞 学 的 发 展 推动 下 ， 
统计 学 迈进 了 推 瞧 绽 秆 的 新 阶段 ， 直 到 20 世纪 50 年 代 ， 是 推断 统计 学 派发 展 最 迅速 的 时 期 。 

2) 东方 社会 经 济 统计 学 

十 月 革命 胜利 后 ， 苏 联 的 大 多 数 统计 学 家 受 社会 统计 学 派 的 影响 ， 主 张 统计 学 是 一 门 实质 性 的 社会 
科学 。1954 年 3 月 ， 由 苏联 科学 院 、 中 央 统 计 局 、 教 育 部 联合 召开 了 统计 科学 讨论 会 ， 并 把 统计 学 定义 
为 ， 统计 学 是 在 质 与 量 的 密切 联系 中 研究 大 量 社会 现象 的 数量 方面 ， 研 究 社会 发 展 规律 在 具体 地 点 及 时 
间 条 件 下 的 数量 表现 的 社会 科学 。 这 一 定义 对 我 国 及 东欧 的 社会 主义 国家 的 影响 都 很 大 ， 在 这 些 国家 中 
形成 了 以 马克 思 政 治 经 济 学 为 理论 基础 的 社会 经 济 统计 学 派 

3. 统计 学 的 发 展 趋势 

现代 主流 统计 学 有 4 个 明显 趋势 ; 四 随 着 现代 数学 的 发 展 ， 更 广泛 地 应 用 数学 方法 ; 回 统计 学 与 
其 他 新 科学 新 理论 的 结合 不断 产 生 新 的 边缘 科学 或 新 的 统计 分 支 ; 回 借助 电子 计算 机 ， 使 大 量 数理 
方法 得 以 普及 应 用 ,并 已 成 为 实证 分 析 的 主要 工具 ; 图 统计 的 作用 从 描述 向 推断 、 预 测 及 决策 方向 
发 展 。 


1.1.2 总 体 与 样本 


1. 总 体 
通常 ， 总 体 (Population) 是 指 根据 研究 目的 确定 的 所 要 研究 的 同类 事物 的 全 体 。 它 


统计 学 与 六 计数 据 | 009 
通常 是 由 具有 某 种 共同 性 质 的 许多 个 体 组 成 的 。 例如， 全国 高 校 教师 组 成 的 全 体 可 以 作为 
-个 总 体 ， 而 其 中 的 每 位 教师 就 是 一 个 个 体 ;天 津 市 所 有 国营 企业 的 全 体 也 可 以 作为 一 个 
总 体 ， 而 其 中 的 每 个 企业 就 是 一 个 个 体 。 

A ei 
的 人 或 事物 的 某 一 个 或 某 几 个 数量 指标 的 分 布 特征 。 例 如 ， 要 检验 一 批 产品 的 合格 率 ， 
一 批 产品 的 全 体 就 是 意 体 。 但 在 统计 研究 中 ， 我 们 只 是 关心 这 批 产品 的 合格 率 ， ee 
品 本 身 。 因 此 ， 我 们 也 可 以 把 这 批 产品 的 合格 率 的 全 体 作为 一 个 总体 ， 这 时 总 体 就 是 一 组 
观测 数据 。 这 就 是 数理 统计 中 所 涉及 的 总 体 的 概念 。 
i i 
观察 值 称 为 个 体 ， 它 是 某 一 随机 变量 的 值 。 这 样 一 个 总 体 对 应 于 一 个 随机 变量 ， 因 此 总 
体 可 用 一 个 随机 变量 X 或 了 来 表示 。 例 如 ， Rt 
全 国 高 校 教师 的 收入 的 全 体 作为 一 个 总 体 六， 而 其 中 每 一 位 教师 的 玻 入 就 是 一 个 个 体 ， 它 
是 总 体 X 的 一 个 可 能 观察 信 ; a 消费 情况 ， 就 将 该 大 学 本 科 
生 的 年 消费 的 全 体 作为 一 个 总 体 Y， 而 其 中 每 一 位 本 匀 刘 的 年 消费 是 一 个 个 体 ， 它 是 总 体 
Y 的 一 个 可 能 观察 什 。 
































Ar 
网 胡 国 向 秽 傅 和 NA i 
S XS 人 
这 了 冯 体 与 无 限 总 体 ,7 
根据 总 体 所 包含 的 0 可 以 分 为 有 限 总 意 和 天 六 体 。 有 限 总 体 是 由 有 限 的 个 体 构 
成 的 总 体 。 例 如 ， 全 国 高 校 师 的 就 是 有 限 总 体 。 无 肛 生 你 是 由 无 展 个 个 体 构成 的 总 体 。 例如 ， 在 


科学 实验 中 ， 每 一 个 实验 数据 可 以 看 作 是 一 th 分 体 ， 而 实验 则 可 以 无 限 地 进行 下 去 ， 因 此 由 
实验 数据 构成 的 总 体 就 车 -个 无 限 总 体 。 下 


io \ de lla ee 


2. 样本 


统计 研究 的 目的 是 确定 总 体 的 数量 特征 。 但 是 ， 当 总 体 中 的 个 体 数量 很 多 甚至 无 限 
时 ,不 必 也 不 可 能 对 构成 总 体 的 所 有 个 体 都 一 一 进行 调查 。 因 此 常常 从 总 体 中 抽取 一 部 分 
个 体 进行 研究 ， 进 而 根据 所 抽 得 的 部 分 个 体 的 数量 特征 来 推断 总 体 。 

样本 (Sample) 就 是 由 总 体 中 抽取 部 分 个 体 组 成 的 集合 ， 构 成 样本 的 个 体 的 数目 称 为 
样本 容量 ， 也 称 为 样本 大 小 。 

在 数理 统计 中 ， 所 谓 从 总 体 中 抽取 一 个 个 体 ， 就 是 对 总 体 X 进行 一 次 观测 并 记录 其 
结果 。 我 们 在 相同 的 条 件 下 对 总 体 久 进行 n 次 重复 的 、 独 立 的 观察 。 将 次 观察 结果 按 实 
验 的 次 序 记 为 Xi ，X2 ，…，X,。 有 理由 认为 Xi ，X2 ，…，X, 是 相互 独立 的 ， 且 都 是 与 
总 体 入 具有 相同 分 布 的 随机 变量 。 这 样 得 到 的 Xi ，Xs ，…，X, 称 为 来 自 总 体 X 的 一 个 
简单 随机 样本 ,nn 称 为 样本 容量 (或 样本 大 小 )。 一 个 样本 对 应 于 一 组 随机 变量 。 以 后 若 
无 男 加 说 明 ， 所 提 到 的 样本 都 是 指 简单 随机 样本 。 

当 nn 次 观察 一 经 完成 ,我 们 就 得 到 一 组 实数 zi ，zs，…，z,， 它 们 依次 是 样本 Xi ， 
XX2，…，X, 的 观测 值 ， 称 为 样本 观测 值 ， 简 称 样本 值 。 
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样本 要 满足 独立 性 及 与 总 体 同 分 布 
从 无 限 总 体 中 抽取 的 样本 可 以 看 作 是 独立 的 ,而 从 有 限 总 体 中 抽取 的 样本 将 受到 前 一 次 所 抽取 的 个 
体 的 影响 。 若 使 得 所 抽取 的 样本 是 简单 随机 样本 ， 对 于 有 限 总 体 ， 采用 放 回 抽样 就 可 以 做 到 ,但 放 回 抽 
样 使 用 起 来 不 方便 ， 因 此 当 总 体 中 个 体 的 总 数 N 比 要 得 到 的 样本 的 容量 n 大 得 多 时 ,在 实际 中 可 将 不 放 
回 抽样 近似 当 作 放 回 抽 样 来 处 理 。 也 就 是 说 ， 当 总 体 中 个 体 的 总 数 N 比 要 得 到 的 样本 的 容量 n 大 得 多 
时 ， 不 管 采用 什么 样 的 抽样 方式 ， 所 得 到 的 样本 都 可 以 近似 看 成 简单 随机 样本 ， 即 样本 满足 独立 性 及 与 
总 体 同 分 布 的 性 质 。 


1.1.3 ”参数 与 统计 时 伦 
1. 参数 AK\ 


多 籽 Cynacn 要 区 站 人 和 从。 有 和 人 六 和 之 
总 体 指标 。 通 常 我 们 所 要 研究 的 参数 主要 有 总 体 平均 数 、 方 差 、 总 体 比例 等 ， 用 和 希腊 字母 
来 表示 。 例 如 ， 总 体 平均 数 用 /表示 ， 总 体 方差 用 守 表 示 ， 总 体 比例 用 表示 。 

由 于 总 体 的 某 种 特征 值 通常 是 未 知 的 、 所 以 参数 是 一 个 未 知 的 常数 。 例 如 ， 我 们 不 知 
道 全 国 高 校 教师 的 平均 收入 及 所 有 高 收入 差异 有 多 大 ， 不 知道 某 工 厂 所 生产 的 一 
批 产 品 的 合格 率 ， 等 等 。 正 因为 如 让 沪 我 们 才 进 行 抽样 志 浪 豫 样本 计算 出 某 些 值 去 估计 总 
体 参 数 。 A 2 

, 7 Xo 

2. 统计 量 X a 2 

NA 
X,)， 不 含 未 站 统计 量 又 称 为 样本 指称 7 通常 我 们 所 要 研究 的 样本 指标 3 
平均 数 、 样 本 方差 、 样 本 比例 等 ， 用 英文 中 的 26 个 字母 来 表示 。 如 样本 平均 数 
样本 方差 用 S: 表 示 ， 样 本 比例 用 p 表示 。 

由 于 样本 是 我 们 已 经 抽取 出 来 的 ， 所 以 统计 量 总 是 可 以 计算 出 来 的 具体 值 。 抽 样 的 目 
的 就 是 用 样本 指标 去 估计 总 体 指标 。 例 如 ， 用 样本 平均 数 亏 去 估计 总 体 平均 数 六 ， 用 样本 
方差 去 估计 总 体 方差 洗 ， 用 样本 比例 p 去 估计 总 体 比例 x， 等 等 。 

总 体 各 指标 都 是 未 知 的 ， 但 是 却 是 唯一 确定 的 ， 是 确定 的 变量 。 而 样本 指标 随 着 抽样 
的 不 同 而 发 生变 化 ， 因 而 都 是 随机 变量 。 


1.1.4 标志 与 指标 






































1. 标志 

标志 (Symbol) 是 用 来 说 明 总 体 中 各 个 个 体 普遍 具有 的 属性 或 特征 。 每 个 总 体 中 的 个 
体 从 不 同方 面 考察 都 具有 许多 属性 和 特征 。 例 如 ， 每 个 学 生 都 具有 性 别 、 年 龄 、 身 高 、 体 
重 等 属性 和 特征 ， 这 些 就 是 学 生 作为 个 体 的 标志 。 

标志 分 为 品质 标志 和 数量 标志 两 种 。 总 体 中 个 体 的 属性 特征 称 为 品质 标志 ， 这 类 标志 
的 变异 不 能 用 数值 表示 。 例 如 ， 在 天 津 市 的 所 有 工业 企业 总 体 中 ,工业 企业 的 名 称 、 所 有 
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制 、 所 在 区 县 等 都 是 品质 标志 。 总 体 中 个 体 的 数量 特征 称 为 数量 标志 ， 这 类 标志 的 变异 能 
用 数值 表示 。 例 如 ， 在 天 津 市 的 所 有 工业 企业 总 体 中 ,工业 企业 的 职工 人 数 、 固 定 资产 、 
工业 增加 值 等 都 是 数量 标志 。 

每 个 总 体 中 的 个 体 既 有 品质 标志 ， 又 有 数量 标志 ， 它 们 在 统计 研究 中 所 采用 的 方法 是 
不 同 的 。 

2. 指标 


指标 (Indication) 是 反映 总 体 数 量 特征 的 概念 及 其 数值 。 它 是 利用 科学 的 统计 方 
法 ， 对 总 体 中 各 个 个 体 的 数量 标志 进行 综合 汇总 而 形成 的 。 一 项 完整 的 统计 指标 有 总 体 
范围 、 时 间 、 地 点 、 指 标 数值 和 数值 单位 等 构成 。 它 具有 以 下 方面 的 特征 : 第 一 ， 统 计 
指标 是 一 定 社会 经 济 范畴 的 具体 表现 ; 第 二 ,统计 指标 具有 可 量 性 ; 第 三 ， 统 计 指 标 具 





有 综合 性 。 

例如 ， 在 某 高 等 学 校本 科教 学 评估 中 ， 人 们 可 以 查 癌 Re 例如 ，2003 年 
某 大 学 具有 高 级 职称 教师 的 人 数 为 150 人 ， 有 3 个 二 站 倾 士 点 ， 有 8 门市 级 精品 课 

， 等 等 。 这 些 指 标 从 某 一 侧面 反映 了 该 大 学 :的 教 尝 求 数量 特征 。 

指标 按 所 反映 的 数量 特点 不 同 可 分 为 数量 指 谊 天 指标. 

1) 数量 指标 全 

凡是 说 明 总 体 规模 大 小 、 数量 多 少 的 未 都 称 为 数量 指标 (Quantitative Indication ) 。 
ee 因由 民 欠 es 用 绝对 数 表示 , 它 是 汇总 的 结果 。 例 

， 在 天 津 市 工业 企业 总 体 申 天 天 讳 市 1 - 业 企 业 总 、 职 站 、 工 业 总 产值 、 商 品 进 出 
口 a 能 源 消耗 总 量 等 ,。 这 丝 指 标 反映 了 现象 或 的 总 规模 和 水 平 。 

2) 质量 指标 ， 一 Wg 

凡是 说 明 总 体 相 水 平 da ey 示 痢 称 为 质量 指标 (Qualitative Indica- 
tion) ， 用 相 Gd 数 表示 ， 它 是 总 量 指 标 的 派生 指标 。 例 如 ， 在 天 津 市 工业 企业 总 体 
中 ,企业 劳 动 生产 率 、 职 工 总 平均 工资 、 工 人 出 勤 率 、 百 元 产值 总 能 耗 等 ， 这 些 指标 用 来 
反映 现象 之 间 的 内 在 联系 和 对 比 关系 ， 更 深刻 地 阐明 现象 发 展 的 规律 性 。 

ee 个 数量 特征 ， 说 明 现 象 的 某 一 个 侧面 的 情况 。 然 而 ， 客 
观 现 象 是 错综复杂 的 ， 要 反映 全 貌 ， 描 述 现 象 发 展 的 全 过 程 ， 只 靠 单个 指标 是 不 够 的 ， 需 
oo 




















HHO 
标志 与 统计 指标 的 区 别 和 联系 回国 
志 系 让 
区 别 : 
(1) 反映 的 事物 范围 大 小 不 同 。 标 志 说 明 总 体 单位 的 属性 特征 ; 统计 指标 反映 的 是 Ee 
总 体 的 数量 特征 。 


(2) 表述 形式 不 同 。 标 志 既 有 能 用 数值 表示 的 数量 标志 ,又 有 能 用 文字 表示 的 品质 标志 ; 统计 指标 
都 是 用 数字 来 表示 的 。 

联系 : 

(1) 标志 与 统计 指标 之 间 具 有 对 应 关系 。 标 志 是 统计 指标 的 核算 基础 ， 它 与 统计 指标 的 指标 名 称 往 
往 是 同一 概念 ， 有 相互 对 应 的 关系 。 
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(2) 具有 汇总 关系 。 许 多 统计 指标 是 由 总 体 单位 的 数量 标志 汇总 而 来 的 。 例 如 ， 某 地 区 工业 总 产值 
(统计 指标 ) 是 各 企业 生产 总 值 (标志) 加 总 之 和 。 
(3) 具有 变换 关 随 着 研究 目的 的 变化 


指标 体系 (Indicative System) 是 各 种 相互 联系 的 指标 群 所 构成 的 整体 ， 用 以 说 明 所 
研究 的 社会 经 济 现象 各 方面 相互 依存 和 相互 制约 的 关系 。 例如， 为 了 评 佑 某 省 各 区 县 的 经 
济 发 展 水 平 ， 需 要 设立 年 末 总 人 口 、 年 末 全 部 就 业 人 口 数 、 失 业 人 口 占 总 人 口 的 比例 、 
内 生产 总 值 、 人 均 国内 生产 总 值 、 第 一 产业 增加 总 值 、 粮 食 总 产量 、 工 业 增 加 总 值 、 社 会 
固定 资产 总 投资 、 社 会 消费 零售 总 额 、 地 方 财政 预算 内 收入 、 城乡 居民 依 敬 存款 余额 、 年 
末 金 融 机 构 贷款 余额 、 农 民 人 均 纯 收入 、 全 部 职工 年 平均 工资 ， 以 及 第 一 、 二 、 三 产业 占 总 
从 业 人 数 的 百分比 等 多 项 指标 ， 米 组 成 该 省 各 区 县 的 经 济 发 展 水 平 的 评估 指标 体系 ， 

指标 体系 的 设置 不 但 是 客观 现象 的 反映 ， 也 是 人 们 对 客观 认识 的 结果 。 确 定 指标 体系 
必须 有 一 定 的 理论 依据 ， 同 时 又 必须 对 计算 口径 加 以 具体 Cf 达到 量化 的 目的 。 在 指 
标 筛选 过 程 中 ， 应 尽量 遵循 目的 性 、 互 补 性 和 可 操作 原 见 ， 目 的 性 体现 在 ， 由 于 研究 目 
的 不 同 ， 指 标 选 择 自然 不 同 ， 在 研究 中 应 选择 与 研 窑 的 胡 显 相关 的 指标 Ff 剔除 那些 与 研 
究 目 的 无 关 或 关系 不 明确 的 指标 。 互补 性 体现 在 求 各 项 指标 分 别 能 反映 客观 现象 的 某 
一 方面 ,综合 起 来 能 反映 其 全 貌 。 a 根据 所 设计 的 指标 体系 ,必须 能 收集 
到 一 些 必要 的 数据 ， 和 否则 必 有 放弃 或 轨 绕 相 度 的 指标 ， 反 过 来 重新 设置 指标 体系 。 


1 .2 


1.2.1 ep i 


Rotel i ee 
和 科学 实验 统计 数据 的 直接 来 源 ， 我 们 称 之 为 第 一 手 资料 或 直接 的 统计 数据 ; 
oti dt a ee eat be 
数据 。 

1. 统计 数据 的 直接 来 源 

统计 数据 的 直接 来 源 主要 有 两 个 渠道 : 一 是 通过 专门 组 织 的 统计 调查 获得 的 数据 称 为 
调查 数据 ， 统 计 调查 是 取得 社会 经 济 数据 的 重要 手段 ; 二 是 通过 科学 试验 得 到 的 数据 称 为 
实验 数据 ， 科 学 试验 是 取得 自然 科学 数据 的 主要 手段 。 

统计 调查 就 是 按照 统计 的 研究 任务 ,运用 科学 的 统计 调查 方法 ， 有 计划 、 有 组 织 地 向 
客观 实际 搜集 资料 的 过 程 。 其 基本 任务 是 : 通过 具体 的 调查 ,取得 反映 社会 经 济 现象 总 体 
数量 全 部 或 部 分 以 数字 资料 为 主 的 信息 。 统 计 调查 与 一 般 社会 调查 一 样 ， 是 调查 研究 活 
动 , 但 它 以 搜集 数字 资料 为 主要 特征 。 统 计 调 查 是 对 总 体 认识 的 起 点 ， 是 进行 统计 整理 与 
分 析 阶 段 工作 的 前 提 。 统 计 调查 的 基本 要 求 是 准确 性 和 及 时 性 。 

科学 实验 是 搜集 数据 的 另 一 种 方法 ， 在 实验 中 控制 一 或 多 个 变量 ， 在 有 控制 的 条 件 下 
得 到 观测 结果 。 所 以 ， 实 验 数 据 是 指 在 实验 中 控制 实验 对 象 而 搜集 到 的 数据 。 en 
验 搜集 数据 的 方法 已 被 广泛 运用 到 各 个 领域 , 除了 工业 、 农 业 等 领域 需要 通过 科学 实验 来 





可 转变 为 总 体 单位 ， 相 应 的 统计 指标 转变 为 标志 。 
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采集 数据 外 ,军事 学 、 心 理学 、 教 育 学 、 社 会 学 、 经 济 学 、 管 理学 的 研究 中 也 有 大 量 地 使 
日 实验 的 方法 获取 所 需要 的 数据 。 


2. 统计 数据 的 间接 来 源 


统计 数据 的 间接 来 源 主要 是 公开 出 版 的 或 公开 报道 的 数据 ,来 源 的 渠道 有 很 多 。 在 我 
国 ， 公 开 出 版 或 报道 的 社会 经 济 数据 主要 来 自 国家 和 地 方 的 统计 部 门 及 各 种 报刊 媒介 ， 如 
公开 出 版 的 各 类 统计 年 鉴 、 定 期 发 布 的 统计 公告 、 hatte hls 
料 、 各 类 经 济 信息 中 心 和 信息 咨询 机 构 等 提供 的 市 场 信息 和 行业 发 展 的 数据 情报 等 

外 ， 广 泛 发 布 在 互联 网 、 各 种 报纸 、 杂 志 、 图 书 、 广 播 、 etn 
于 间接 数据 。 

相对 而 言 ， 这 种 间接 数据 的 搜集 比较 容易 ， 采 集 数据 的 成 本 低 ， 并且 能 很 快 得 到 。 但 
是 ,间接 数据 也 有 很 大 的 局 限 性 ， 研 究 者 在 使 用 间接 数据 时 要 保持 遵 慎 的 态度 。 因 为 间接 数 
据 并 不 是 为 你 特定 的 研究 问题 而 产生 的 ， tot 的 指标 体系 来 采集 数据 ， 
并 不 是 一 件 容易 的 事 ， 如 经 常会 碰 到 数据 资料 不 够 全 面 确 性 不 够 、 数 据 资料 的 口 
径 可 能 不 一 致 等 问题 。 另 外 ， 提 醒 研 究 ee 一 定 要 注 明 数据 
资料 的 来 源 。 这 样 做 一 J 重 他 人 的 劳动 成 果 。 回 ) 
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伪造 统计 资料 ， pe ES i 
的 行为 。 构 成 伪造 统计 资料 仿 具 备 两 个 条 件 : RS 汪 必 须 是 故意 的 ; 二 是 必须 有 捏造 虚假 的 
统计 资料 并 上 报 的 行 贡 < 具体 表现 为 ， 行为 人 所 毛 送 的 评 数据 或 者 统计 资料 ， 没有 相应 的 原始 记录 、 
统计 台 账 和 其 关 人 的 纶 证。 或 者 捏造 一 庄原 刀 交 鲜 光 料 和 汇总 资料 。 例如 ， 某 村 实际 上 没有 轧钢 厂 ， 
但 该 村 为 了 完成 里 下 达 的 任务 ,在 报 送 统 错 唆 料 时 凭空 造 出 一 个 轧钢 厂 ， 并 以 该 村 的 名 义 报 送 工 
业 产 值 1000 A 

自 改 统计 资料 ， 是 指 行为 人 利用 某 种 职务 或 者 工作 上 的 便利 条 件 ， 擅自 修改 现 有 的 统计 资料 并 报 送 
的 行为 。 构 成 自 改 统计 资料 须 具备 两 个 条 件 : 一 是 行为 人 在 主观 上 必须 是 故意 的 ， 即 明知 被 修改 的 统计 
资料 是 真实 的 ， 修 改 的 结果 必然 导致 数据 失真 ， 但 仍然 希望 这 种 结果 发 生 ; 二 是 必须 有 故意 臭 改 统计 资 
料 的 行为 ， 例 如 ， 某 县 乡镇 企业 公司 为 了 达到 “全 县 乡镇 企业 稳步 快速 发 展 ” 和 “明年 日 子 好 过 ”的 目 
用 “以 丰 补 菊 ” 的 方法 擅自 对 该 县 某 村 5 个 企业 1995 年 实际 上 报 的 工业 总 产值 22500 万 元 进行 修 

， 修 改 后 的 工业 总 产值 只 剩 6200 万 元 。 

伪造 和 纂 改 统计 资料 区 别 在 于 : 伪造 统计 资料 是 凭空 捏造 ， 无中生有; 签 改 统计 资料 是 在 现 有 的 统 
计 资 料 的 基础 上 进行 非法 修改 。 回音 吧 回 

判断 虚报 、 瞒 报 、 伪 造 、 纂 改 统计 资料 的 标准 : 如 果 行 为 人 是 通过 伪造 或 者 算 改 的 手 并 
段 而 导致 统计 数据 失实 ， 则 其 行为 应 认定 为 伪造 或 者 每 改 统计 资料 的 违法 行为 ， 如 果 行 为 
人 未 通过 伪造 或 者 自 改 的 手段 ， 而 是 由 于 其 他 原因 导致 统计 数据 失实 ， 则 其 行为 应 认定 为 
虚报 或 者 瞒 报 统计 资料 的 违法 行为 。 

资料 来 源 : 天 津 统计 信息 网 http: //www. stats tj. gov. cn. 


1.2.2 统计 数据 的 类 型 
统计 数据 是 对 现象 进行 计量 的 结果 。 下 面 我 们 从 不 同 角度 说 明 统 计数 据 的 分 类 。 
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1. 分 类 数据 、 顺 序数 据 和 数值 型 数据 

按照 所 采用 的 计量 尺度 不 同 ， 可 以 将 统计 数据 分 为 分 类 数据 、 顺 序数 据 和 数值 型 
数据 。 

1) 分 类 数据 

只 能 归于 某 一 类 别 的 非 数 字 型 数据 ， 称 为 分 类 数据 (Categorical Data)。 例 如 ， 人 口 
按照 性 别 可 分 为 男 、 女 两 类 ;企业 按照 经 济 性 质 可 分 为 国有 企业 、 集 体 企业 、 三 资 企业 和 
个 体 企业 等 。 这 类 数据 是 无 序 的 ， 没 有 大 小 的 比较 。 

为 便于 统计 处 理 ， 对 于 分 类 数据 可 以 指定 数字 代码 表示 。 例 如 ， 用 0 表示 男性 ， 用 1 表 
示 女 性 ; 用 1 表示 国有 企业 ， 用 2 表示 集体 企业 ,用 3 表示 三 资 企业 ， 用 4 表示 个 体 企业 。 

2) 顺序 数据 r 

只 能 归于 某 一 有 序 类 别 的 非 数字 型 数据 ， 称 为 顺序 数据 (KR 有 Data) 。 例如， 学 生 的 
考试 成 绩 可 以 分 为 优 、 良 、 中 、 及 格 和 不 及 格 ; 消费 者 对 产品 的 偏爱 程度 可 以 分 为 很 喜 
en 

A a 兵 用 1 表示 优 ， 用 2 表示 良 ， 用 3 
表示 中 ,用 4 表示 及 格 , 用 5 表示 不 及 格 ; 用 4 表示 很 喜欢 ， 用 3 表示 喜欢 ， 用 2 表示 一 
般 喜 欢 ， 用 1 表示 不 喜欢 。 5 
3) 数值 型 数据 YO- 

按照 数字 尺度 测量 的 观测 值 、 称 为 数值 型 数据 (Mersie Data) 。 我 们 所 研究 的 数据 大 
多 是 属于 这 类 数据 。 数值 型 数据 按 取 值 方式 可 以 分 为 离散 数值 型 数据 和 连续 数值 型 数据 。 
例如 ， 到 现在 为 目 你 订 过 杂志 的 数量 、 你 家 里 的 人 由 数 等 ， 都 属于 离散 数值 型 数据 ， 你 的 
身高 、 体 重 等 ， 都 届 于 连续 数值 型 数据 。 家 

分 类 数据 和 顺 岩 数据 说 明 的 是 事物 的 请 质 特征 ， 通 常用 文字 表示 ;而 数值 型 数据 说 明 
的 是 现象 的 数 盖 特征 ,通常 用 数值 表示 。” > 

2. 观察 数据 和 实验 数据 

按照 统计 数据 的 收集 方法 ， 可 以 将 统计 数据 分 为 观测 数据 和 实验 数据 。 

1) 观察 数据 

通过 调查 或 者 观测 而 收集 到 的 数据 ， 称 为 观察 数据 〈Observational Data) 。 这 类 数据 
是 在 没有 对 事物 人 为 控制 的 条 件 下 所 得 出 的 ， 有 关 社 会 经 济 现象 的 统计 数据 几乎 都 是 观察 
数据 。 

2) 实验 数据 

在 实验 中 控制 实验 对 象 而 收集 到 的 数据 ， 称 为 实验 数据 (Experimental Data) 。 在 自 
然 科 学 领域 中 应 用 时 所 使 用 的 统计 数据 大 多 是 实验 数据 。 

3. 截面 数据 和 时 间 序 列 数据 

按照 被 描述 的 对 象 与 时 间 之 间 的 关系 ,可 以 将 统计 数据 分 为 截面 数据 与 时 间 序列 
数据 。 

1) 截面 数据 

截面 数据 (Cross - Sectional Data) 是 指 在 相同 或 近似 相同 的 时 间 点 上 所 收集 的 数据 ， 
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用 来 描述 现象 在 某 一 时 刻 的 变化 情况 。 例 如 ，2015 年 我 国 各 地 区 的 GDP 数据 就 属于 截面 
数据 。 
2) 时 间 序 列 数据 
时 间 序 列 数据 (Time Series Data) 是 指 在 不 同时 间 上 所 收集 到 的 数据 ,用 来 描述 现 
象 随时 间 而 变化 的 情况 。 例 如 ，1996 一 2015 年 我 国 的 GDP 数据 就 属于 时 间 序 列 数据 。 由 
一 系列 时 间 序 列 数据 排列 而 得 出 的 一 组 数据 称 为 时 间 序列 ， 又 称 为 动态 数列 。 对 于 时 间 序 
列 的 研究 是 统计 学 中 的 一 个 重要 的 内 容 。 
区 分 统计 数据 的 类 型 十 分 重要 ， 因 为 对 不 同类 型 的 数据 将 采用 不 同 的 统计 方法 来 处 理 。 
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工程 与 科学 中 的 试验 研究 一 般 都 牵涉 利用 试验 数据 (样本 ) SN 念 性 总 体 的 性 质 ， 而 这 个 概 
念 性 的 总 体 刻画 了 实验 者 感 兴趣 的 现象 。 ee Rt 个 组 成 部 分 。 基 于 试验 数据 的 推 
断 首先 用 来 提出 有 关 现 象 的 理论 ， A 这 个 理论 。 

统计 科学 对 这 个 过 程 是 怎样 发 挥 作用 的 ? 为 地 加 题 ， 我 们 必须 注意 基于 样本 数据 的 推断 几 
平 都 是 有 误差 的 ， ip i 供 的 信息 特征 依赖 于 选取 的 特定 样本 ， 因 
此 不 同样 本 得 到 的 信息 是 不 一 样 的 。 例如 本 所 有 应 力 腐蚀 破裂 而 导致 合 
金 钢 损 坏 的 比例 ， 你 调查 了 一 RS 个 有 
是 否 意味 着 在 石化 工厂 中 所 有 合金 项 台 傈 大 精确 地 有 47% Ay 裂 造成 的 呢 ? 显然 不 是 。 假 定 你 
不 知道 合金 钢 损 坏 应 力 腐蚀 烈 多 页 实 百分比 是 44%。 10 wy 的 样本 可 能 有 47 个 是 应 力 腐蚀 破裂 导 
致 的 ， 而 另 一 oe RE ;基于 样本 的 推断 具有 不 确定 性 。 

另 一 方面 ， ee 次 合作 钢 损 环 率 为 81%， 当 给 定 样本 损坏 率 为 47%% 时 ， 
否 是 一 个 非常 草包 7? 统计 理论 用 概率 谢 盘 关于 推断 的 不 确定 性 。 二 放下 各 和 条 果 二 全 
力 在 有 关 总 体 的 特 SN 计算 观测 到 的 特殊 样本 或 者 数据 测量 值 的 概率 。 这 些 概率 用 来 评估 关于 样 
本 推断 的 不 确定 性 。 例 如 ,在 给 定 的 样本 信息 下 ， 我们 可 以 通过 计算 观测 到 如 此 高 比例 的 机 会 ， 来 确定 
工厂 81 多 的 合金 钢 损坏 率 是 否 非常 高 。 

因此 ， 统 计 学 的 主要 贡献 是 ， 使 得 工程 师 和 科学 家 能 够 用 已 知 的 可 靠 性 度量 做 出 推断 (关于 目标 总 
体 的 估计 及 决策 )。 这 样 工程 师 可 以 根据 数据 做 出 明智 的 决策 与 推断 ， 即 统计 学 帮助 工程 师 批 判 性 地 思考 
他 们 的 结论 

资料 来 源 ; [ 美 ] William Mendenhall，Terry Sincich. 统计 学 [MJ]. 梁 冯 珍 。 关 静 ， 等 译 . 北京 : 机 
械 工业 出 版 社 ，2009. 


LA 实例 分 析 、 
解读 《2015 年 国民 经 济 和 社会 发 展 统计 公报 一 一 工业 》 


根据 国家 统计 局 网 站 公布 的 《2015 年 国民 经 济 和 社会 发 展 统计 公报 》， 全 国 工 业 增 加 
值 及 同比 增长 如 图 1.3 所 示 。 
全 年 全 部 工业 增加 值 为 228974 亿 元 ， 比 上 年 增长 5. 9%。 规 模 以 上 工业 增加 值 增长 
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图 1.3 2015 年 全 国 工业 增加 值 及 同比 增长 


6. 1% 。 在 规模 以 上 工业 中 ,分 经 济 类 型 看 ， sen ek 集体 企业 增长 
1.2%i， 股 份 制 企业 增长 7.3%%i， 外 商 及 港澳 台 商 投 长 3.7%， 私 营 企业 增长 
8.6%。 分 门类 看 ， 采 矿业 增长 2.7%， ER 热力 、 燃 气 及 水 生产 和 
供应 业 增长 1. 4%。 

全 年 规模 以 上 工业 中 ， 农 副食 品 加 工业 
化 学 原料 和 化 学 制品 制造 业 增 长 9. 5%* 人 5 最 ， 黑 色 金 属 冶 炼 和 
压延 加 工业 增长 5. 4 ,通用 设备 制 ~ 9%%， 雪山 业 在 击 境 业 二 和 和 4%， 汽车 制 
造 业 增长 6.7%， 电气 机 械 和 器 村 市 增长 7.3%， St 
业 增 长 10.5% ， 电 力 、 机 天 高 耗 能 行业 增加 值 比 上 年 增长 
6. 3%， 占 规模 以 上 工业 ee 
机 上 上 生生 交加 信 允 各 ne 加 值 增 长 6.8%， 占 规模 以 上 工业 增加 


值 的 比例 为 31N8% 

et 

(1) 试 描述 该 研究 的 统计 目的 。 

(2) 由 2015 年 全 国 工 业 增加 值 及 同比 增长 图 可 以 看 出 哪些 统计 数据 ? 

(3) 调查 了 哪些 企业 ? 

(4) 试 描述 该 研究 的 统计 分 析 过 程 。 

一 、 学 习 目 标 

通过 本 案例 的 学 习 ， 要 求学 生 结 合 实际 问题 熟练 掌握 基本 的 统计 分 析 过 程 ， 正确 理解 
统计 学 的 基本 概念 。 

二 、 案 例 分 析 

(1) 该 研究 的 统计 目的 是 掌握 2015 年 全 部 工业 增加 值 及 同比 增长 情况 。 

(2) 由 2015 年 全 国 工 业 增加 值 及 同比 增长 图 可 以 看 出 的 统计 数据 如 下 : 2015 年 ， 全 
年 全 部 工业 增加 值 为 228974 亿 元 ， 比 上 年 增长 5.9%。 

(3) 调查 了 全 国 规模 以 上 工业 企业 ,其 中 包括 国有 及 国有 控股 企业 、 集 体 企 业 、 股 份 
制 企业 、 外 商 及 港澳 台 商 投资 企业 和 私营 企业 等 。 

(4) 首先 从 宏观 范围 分 析 了 全 年 全 部 工业 增加 值 及 其 同比 增长 情况 。 接 下 来 ， 具 体 分 
析 了 规模 以 上 工业 企业 中 不 同类 型 的 企业 ， 如 国有 及 国有 控股 企业 、 集 体 企业 、 股 份 制 企 
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、 外 商 及 港澳 台 商 投资 企业 、 私 营 企 业 等 工业 增加 值 增长 情况 ; 并 对 39 个 工业 大 类 中 
的 不 同行 业 ， 如 煤炭 开采 和 洗 选 业 、 石 油 和 天 然 气 开采 业 、 农 副食 品 加 工业 、 纺 织 业 、 通 
用 设备 制造 业 、 专 用 设备 制造 业 、 交 通 运输 设备 制造 业 、 通 信 设 备 、 计算 机 及 其 他 电子 设 
备 制 造 业 、 电 气 机 械 及 器 材 制造 业 、6 大 高 载 能 行业 、 高 技术 制造 业 等 的 工业 增加 值 增长 
情况 进行 了 统计 分 析 。 





本 章 是 应 用 统计 基础 的 开篇 章 ， 主 要 六 述 统计 学 的 基本 理论 和 基本 概念 。 通过 本 
章 的 学 习 ， 要 求 对 这 门 课 程 有 一 个 初步 的 认识 ， ee 的 研究 对 象 、 特 点 、 





研究 过 程 及 方法 ， 熟 练 掌握 贯穿 于 本 门 课程 的 基本 概念 A 学 习 全 书 各 章节 内 容 
英 定 理论 基础 。 


ED 
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习 题 1 
、 选 择 是 
1. 社会 经 济 统计 的 研究 对 象 是 ( 。 )。 
A. 抽象 的 数量 特征 和 数量 关系 
B. 社会 经 济 现象 的 规律 性 
C. 社会 经 济 现象 的 数量 特征 和 数量 关系 
D. 社会 经 济 统计 认识 过 程 的 规律 和 方法 
2 工业 企业 的 设备 人 台数、 产品 产值 是 ( 。 )。 
A， 连续 数值 型 数据 
B.， 离 散 数 值 型 数据 人 险 
C. 前 者 是 连续 数值 型 数据 ， 后 者 是 离散 数值 型 数据 KK 
D. 前 者 是 离散 数值 型 数据 ， 后 者 是 连续 数值 型 
3. 几 位 学 生 的 某 门 课 成 绩 (单位 :分 ) A v 78、88、89、96， “学 生成 绩 ” 
是 ( 和 >、 
A. 品质 标志 BE. 到 “长 XC 标志 值 D. 数量 指标 
4. 在 全 国人 口 普查 中 人 AS- 
A. 男性 是 品质 标志 RN B。 人 的 储 天 是 离散 数值 型 数据 
区 人 口 的 平均 寿命 是 数量 未 起 D. 旨 
5. 下 列 指标 中 属于 人 
A. 社会 总 产值 不。 |B. 产品 合 NS 产品 D. 人 口 总 数 
6. 指标 是 说 而 你 特 征 的 ， 标 A ). 
A. pt ee pre B. 标志 和 指标 之 间 的 关系 是 可 以 变化 的 
C. 标志 和 指标 都 只 能 用 数值 表示 D. 只 有 指标 才 可 以 用 数值 表示 
7. 统计 指标 按 所 反映 的 数量 特点 不 同 可 以 分 为 数量 指标 和 质量 指标 两 种 。 其 中 数量 
指标 的 表现 形式 是 ( 。 )。 
A. 绝对 数 B. 相对 数 C. 平均 数 D. 百分数 
8. 要 了 解 某 地 区 的 就 业 情况 ，( 25 
A. 全 部 成 年 人 是 研究 的 总 体 B. 成 年 人 口 总 数 是 统计 指标 
C. 成 年 人 口 就 业 率 是 统计 标志 D. 反映 每 个 人 特征 的 职业 是 数量 指标 
E. 某 人 职业 是 教师 是 标志 值 
9. 下 列 统计 指标 中 ， 属 于 质量 指标 的 有 ( 。 )。 
A. 工资 总 客 B. 平均 产品 成 本 C. 出 惑 人 数 。 。 D. 人 口 密度 
FE. 合格 品 率 
10. 下 列 各 项 中 ， 属 于 连续 型 变量 的 有 ( 。。)。 
A. 基本 建设 投资 额 B. 岛屿 个 数 
C. 国民 生产 总 值 D. 居民 生活 费用 价格 指数 
E. 就 业 人 口 数 
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二 、 简 答题 
1. 区 别 下 列 概念 。 
(1) 统计 与 统计 学 
(2) 总 体 与 样本 。 
(3) 标志 与 指标 。 
(4) 数量 指标 与 质量 指标 。 
(5) 分 类 数据 与 数值 型 数据 。 
(6) 描述 统计 学 与 推断 统计 学 。 
2. 下 面 这 些 数 据 是 分 类 数据 、 顺 序数 据 还 是 数值 型 数据 ? 如 果 是 数值 型 数据 ， 是 离 
散 型 还 是 连续 型 ? 





(1) 性 别 : 男 , 女 。 ^ 
(2) 体重 : 123，140. 2 等 。 i 险 
(3) 汽车 速度 78，64，45 等 。 愉 
(4) 温度 : 78，64，85 等 。 PR 


pcw 
(6) 成 绩 ， A，B，C 等。 l 

人 ， 中 立 ， 反 对 。 

(8) 产品 中 的 次 品 数 : 0 

3. 某 大 学 欲 了 解 在 校 大 学 生 
们 的 身高 、 体 重 。 > 

Q) 从 总 体 的 两 层 1 i as 

(2) 给 出 相应 的 样本 及 其 容量 。 上 

(3) 该 大 学 玫 牙 条 的 什么 特征 感 兴趣 ? 

4 根据 总体 的 一 般 性 定义 ， ten 样本 和 个 体 。 哪 些 是 有 
限 总 体 ?哪些 是 无 限 总 体 ? 

(1) 天 津 市 2015 年 大 学 生 应 届 毕 业 生 初次 就 业 的 情况 。 

(2) 2015 年 全 国 国 有 企业 经 济 效益 情况 。 

(3) 随机 抽样 得 到 1000 名 在 校 大 学 生 上 一 年 伙食 费 支出 的 数据 ， 推 断 全 校 在 校 大 学 
生 上 一 年 平均 伙食 费 支 出 。 

(4) 某 市 质 检 部 门 从 市 场 上 抽取 不 同 品牌 的 奶粉 共 80 袋 ， 试图 对 市 场 上 销售 的 奶粉 
的 质量 做 出 评估 。 

(5) 从 中 小 企业 板块 随机 抽取 40 支 股票 的 连续 30 天 的 价格 ， 分 析 该 板块 股票 价格 波 
动情 况 。 

5. 某 咨询 公司 准备 在 全 市 200 万 个 家 庭 中 抽取 2000 个 家 庭 ， 据 此 推断 该 城市 所 有 职 
工 家 庭 的 年 人 均 收入 。 从 数理 统计 的 角度 指出 ， 

(1) 这 项 研究 的 总 体 是 什么 ? 

(2) 这 项 研究 的 样本 是 什么 ? 

(3) 这 项 研究 的 参数 是 什么 ? 

(4) 这 项 研究 的 统计 量 是 什么 ? 





pe es 测量 了 他 
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6. 一 家 工厂 的 质量 检验 人 员 某 日 从 该 企业 共 随 机 抽取 100 件 产品 ， 以 检验 产品 的 合格 
率 。 根 据 这 一 事实 回答 下 列 问 题 : 

(1) 根据 总 体 的 一 般 性 定义 ,指出 此 项 统计 研究 的 总 体 、 个 体 和 样本 。 

(2) 指出 此 项 统计 研究 的 指标 。 

(3) 指出 此 项 统计 研究 所 确定 的 指标 是 数量 指标 还 是 质量 指标 。 

(4) 指出 此 项 统计 研究 的 参数 和 统计 量 。 

7. 某 单位 由 10 个 部 门 组 成 一 个 总 体 ， 下 面 哪 些 是 数量 指标 ? 哪些 是 质量 指标 ? 

(1) 10 个 部 门 的 职工 人 数 。 

(2) 第 3 个 部 门 的 职工 年 工资 总 额 。 

(3) 该 单位 固定 资产 总 值 。 

(4) 第 9 个 部 门 职工 的 年 平均 工资 总 额 。 ^ 

(5) 10 个 部 门 的 平均 劳动 生产 率 。 | 

8. 假设 我 Pt Om rhe 


表 1-2 2016 年 1~4 月 份 规模 以 上 工 要 财务 指标 














































































利润 总 额 
分 组 4 月 1~4 月 同比 增长 
NN / 亿 元 / 亿 元 /% 
总 计 335613.8 18442.2 6.5 
采矿 业 ~ 13910:9 一 40.3 一 104.8 
其 中 | 制造 业 yA 302M0%@1| ”3. 16783.7 13.3 
电力 、 热 力 、 二 Ts 一 1.6 1698. 8 1 
其 中 国有 控股 企业 ~ : yf doBl7.1 | 一 55 | 3265.5 一 7.8 
2 FN 2041.1 | -2.1 137.3 0.4 
其 中 | 股份 制 企 业 234751.6 $8 12316. 4 7.4 
外 商 及 港澳 台 商 投资 企业 76138. 1 二 仙 信 4761.6 7.3 
其 中 | 私营 企业 117489.3 5.9 6626. 1 8.4 














经 济 类 型 分 组 之 间 存 在 交叉 ， 故 各 经 济 类 型 企业 数据 之 和 大 于 总 计 





要 求 : (1) 试 指出 表 1- 2 中 的 总 体 、 总 体 单位 、 数 量 指标 、 质 量 指标 。 
(2) 为 获得 表 1-2 中 的 资料 ， 应 调查 总 体 单位 的 哪些 标志 ? 哪些 标志 是 品质 标志 ? 
哪些 标志 是 数量 标志 ? 


三 、 判 断 题 
1. 对 某 市 工程 技术 人 员 进 行 普查 ,该 市 工程 技术 人 员 的 工资 收入 水 平 是 数量 标志 。 
( 
. 社会 经 济 统 计 学 的 研究 对 象 是 社会 经 济 现象 的 数量 方面 , 但 它 在 具体 研究 时 也 离 
不 开 a ( 





3. 品质 标志 表明 单位 属性 方面 的 特征 ,其 标志 表现 只 能 用 文字 表现 ， 所 以 品质 标志 
不 能 直接 转化 为 统计 指标 。 ( 
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4. 品质 标志 说 明 总 体 单 位 的 属性 特征 ， 质 量 指标 反映 现象 的 相对 水 平 或 工作 质量 


二 者 都 不 能 用 数值 表示 。 ( ) 
5. 某 一 职工 的 文化 程度 在 标志 的 分 类 上 属于 品质 标志 ， 职 工 的 平均 工资 在 指标 的 分 
类 上 属于 质量 指标 。 ( ) 


已 实际 操作 训练 


1. 实 训 项 目 ， 消费 者 网 上 购物 统计 调查 
实 训 目 的 :掌握 统计 调查 中 常用 的 统计 基本 概念 ， 理 解 并 会 正确 使 用 . 
实 训 内 容 ， 一 项 调查 表明 ， 消 费 者 每 月 在 网 上 购物 的 平均 花费 是 500 元 ， 他 们 选择 在 
网 上 购物 的 主要 原因 是 “价格 便宜 "。 同 答 以 下 问题 ， 
(1) 这 一 研究 的 总 体 是 什么 ? 入 
) “消费 者 在 网 上 购物 原因 ”是 分 类 数据 、 顺 序 ri 
(3) 研究 者 所 关心 的 参数 是 什么 ? 
4 “清理 Pre 参数 还 是 统计 量 ? 
(5) 研究 者 所 使 用 的 主要 是 描述 统计 还 计 的 方法 ? 
2. 实 训 项 目 ， ee 计 调查 























实 训 目 的 ， 掌 握 统计 调查 中 党 用 韵 统计 基本 概念 ， 理 解 并 会 正确 使 用 。 

实 训 内 容 ， 某 科研 机 构 对 本 市 这 间 内 的 5 所 高 校 在 楼 学生 的 择业 观念 情况 进行 了 调 
查 ， 以 了 解 新 时 期 大 学 生 的 择业 倾 疝 、 择业 心态 及 其 全 灾 活 动 的 主要 目的 是 为 政府 制定 
大 学 生 就 业 的 政策 法 规 汶 管理 制度 ， 增 强 宏观 理 的 科学 性 和 针对 性 提供 依据 : 为 高 校 的 
有 关 大 学 生 就 业 指导 种 必 针对 性 地 做 好 大 学 生 就 业 指导 工作 提供 信息 支持 ， 为 高 校 的 大 
学 生 择 业 思 想 在 提 征 客观 的 依据 ， 培养 大 学 生 正确 的 择业 观 和 人 生 观 。 

在 这 让， 他 们 是 如 用 定 统计 总 体 和 样本 的 ? 在 调查 中 又 有 可 能 出 现 哪些 
统计 概念 呢 ? 

3. 组 成 学 习 探 讨 小 组 ， 每 组 提出 一 项 统计 研究 目的 ， 列 出 为 此 而 开展 统计 研究 的 总 
体 和 样本 ， 并 同时 列 出 其 中 的 标志 (品质 标志 和 数量 标志 )、 指 标 数量 指标 和 质量 指标 ) 
等 ， 并 尝试 构建 一 套 指标 体系 。 


[各 < 录 例 思考 与 讨论 
解读 《2014 年 国民 经 济 和 社会 发 展 统计 公报 》 部 分 内 容 


2014 年 ， 面 对 复杂 多 变 的 国际 环境 和 艰巨 繁重 的 国内 发 展 改 革 稳 定 任 务 ， 党 中 央 、 
国务 院 团结 带领 全 国 各 族人 民 ， 牢 牢 把 握 国 内 外 发 展 大 势 ， 坚持 稳 中 求 进 工作 总 基调 ， 全 
力 推进 改革 开放 ， 着 力 创新 宏观 调控 ， 奋 力 激发 市 场 活力 ， 努 力 培育 创新 动力 ， 国 民 经 济 
在 新 常态 下 平稳 运行 ,结构 调整 出 现 积 极 变化 ,发 展 质量 不 断 提高 ， 民生 事业 持续 改善 ， 
实现 了 经 济 社会 持续 稳定 发 展 。 

一 、 农 业 

全 年 粮食 种 植 面积 11274 万 公顷 ， 比 上 年 增加 78 万 公顷 。 棉 花 种 植 面积 422 万 公顷 ， 
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减少 13 万 公顷 。 油 料 种 植 面积 1408 万 公 项 ， 增 加 6 万 公顷 。 糖 料 种 植 面积 191 万 公 项 ， 
减少 9 万 公顷 。 

粮食 再 获 丰 收 。 全 年 粮食 产量 60710 万 吨 ， 比 上 年 增加 516 万 吨 ， 增产 0.9%。 其 中 ， 
夏粮 产量 13660 万 吨 ， 增 产 3.6%; 早稻 产量 3401 万 吨 ， 减产 0.4%; 秋粮 产量 43649 万 
吨 ， 增 产 0.1%。 全 年 谷物 产量 55727 万 吨 ， 比 上 年 增产 0.8%%。 其 中 ， 稻谷 产量 20643 
万 吨 ， 增 产 1.4%; 小 麦 产 量 12617 万 吨 ， 增产 3.5%; 玉米 产量 21567 万 吨 ， 减 
和 

二 、 固 定 资产 投资 

固定 资产 投资 增 速 放 缓 。 全 年 全 社会 固定 资产 投资 512761 亿 元 ， 比 上 年 增长 15.3%， 
扣除 价格 因素 ， 实 际 增长 14.7 吕 。 其 中 ,国定 资产 投资 〈 不 含 农户 ) 502005 亿 元 ， 增 长 
15.7%， 农 户 投资 10756 亿 元 ， 增 长 2.0%。 东 部 地 区 投资 206454 亿 元 ， 比 上 年 增长 
15.4%; 中 部 地 区 投资 124112 亿 元 ， 增 长 17.6%; 丁 疼 地 区 多 次 129171 亿 元 ， 增 长 
17. 2%; 东北 地 区 投资 46096 亿 元 ， 增 长 2.7% 。 SS 

三 、 国 内 贸易 了 

市 场 销售 稳定 增长 。 全 年 社会 消费 品 零 售 总 额 (262394 亿 元 ， 比 上 年 增长 12.0%， 扣 
除 价格 因素 ， 实 际 增长 10.9 中 。 按 经 营地 编 计 心 城镇 消费 品 零售 额 226368 亿 元 ， 增 长 
11. 8%; 乡村 消费 品 零售 额 36027 亿 开 增长 12.9%。 按 消费 类 型 统计 ， 商 品 零 售 额 
234534 亿 元 ， 增 长 12. 2%， 餐饮 收入 额 、 7860 亿 元 ， 增长 9.7%。 全 年 网 上 零售 额 27898 
亿 元 ， 比 上 年 增长 49.7 中 。 其 中 必 江 剖 以 上 单位 网 上 看 笑 让 4400 人 元， 增长 56.2% 。 

四 、 对 外 经 济 A Yr WX 

全 年 货物 进出 口 总 额 264334 亿 元 ， 比 上 年 增 其 人 Sw%. 其 中 ， 出 口 143912 亿 元 ， 增 
长 4.9%; 进口 120423 亿 元 ， 下 降 0. 6%。 ,进出 加 差 作 (出 口 减 进 口 ) 23489 亿 元 ， 比 上 
年 增加 7395 公 庆 。 br 人 

根据 以 上 党 向 回答 下 列 问题 ， | 

(1) 举例 说 明 统 计 的 研究 对 象 是 什么 

(2) 案例 中 提 到 了 什么 统计 总 体 ? 

(3) 案例 中 提 到 的 标志 有 几 种 ? 举例 说 明 什 么 是 指标 。 

(4) 案例 中 用 了 什么 研究 方法 ? 











解读 2009 年 《中 华人 民 共 和 国 统计 法 》 的 修订 内 容 





解读 2009 年 《中 华人 民 共 和 国 统计 法 》 的 修订 内 容 。 分 小 组 讨论 : 
加 国 “1) 2009 年 新 修订 的 《中 华人 民 共和 国 统计 法 》 有 何 意义 ? 
守 (2) 结合 实际 提出 保障 统计 数据 质量 、 提 高 统计 公信 力 的 建议 和 措施 


【相关 法 规 】 
































rem: 
【参考 答案 】 


第 公章 
统计 数据 的 收集 、 整 理 与 显示 


| & 0D ,A 
ee 
通过 本 章 学 习 ， 能 够 了 解放 据 收集 、 整理 和 显示 的 合 义 江 代 解 常用 的 统计 调查 方法 ， 学 全 
设计 调查 方案 和 调查 问卷; 了解 统计 教 据 的 误差 的 来 源 说 党 电 雪 据 分 组 和 数据 频 雪 分 布 表 编 制 





的 方法 ;了 解 常用 统计 图 表 的 绘制 方法 。 x A 
NS 
| «nD Se 
AN 
知识 要 点 能 力 要 相关 知识 
ES AN 
了 解 坎 据 收集 方法 及 常用 的 统计 i 调 , | 人 本 
歼 据 收集 和 二 丸 | 能 设计 调查 方案 和 中]| 权 、 王 点 调查 、 内 型 肖 间 、 抽 相 
ER XxX 六 调查 、 统 计 报表 、 问 卷 设计 
~ WA 





下 一 
地 所 款 玛 NS 能 够 根据 教 据 类 型 及 特 狂 进行 数据 单项 式 分 组 、 组 距 式 分 组 、 向 上 累 
入 分 组 并 编制 频数 分 布 表 计 、 向 下 累计 








数据 显示 能 够 绘制 和 解释 统计 图 表 的 含义 统计 表 、 统 计 图 





我 们 知道 ， 统 计 学 是 一 门 应 用 性 方法 论 学 科 ， 是 用 来 处 理 分 析 现 实 经 济 现象 的 ， 而 现实 经 
济 现象 的 表现 就 是 数据 ， 所 以 本 章 介绍 对 数据 进行 处 理 的 第 一 个 步骤 ,就 是 数据 的 搜集 、 整 理 
与 显示 ， 本 章 是 后 面 各 章 的 基础 。 由 于 数据 是 分 析 的 对 象 ， 所 以 必须 通过 合理 有 效 的 数据 收集 
方法 ， 才 能 得 到 高 质量 的 数据 。 为 了 便于 数据 的 分 析 ， 我 们 还 要 对 收集 到 的 数据 进行 整理 ， 使 
其 显示 出 一 定 的 数量 特征 ， 对 数据 进行 整理 的 技术 也 非常 重要 。 
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研究 垃圾 
一 般 人 听 起 来 ， 研 究 垃圾 是 个 荒唐 的 举动 ， 对 经 营 决策 不 会 有 什么 帮助 。 但 事实 恰恰 相反 ,著名 的 
雪 佛 隆 公 司 花 重金 聘请 亚利桑那 大 学 教授 威廉 雷 兹 对 垃圾 进行 研究 ， 教 授 每 天 尽 可 能 多 地 收集 垃圾 ， 然 
后 按 垃圾 的 内 容 ， 以 及 所 标明 的 产品 的 名 称 、 质 量 、 数 量 、 包 装 形式 等 予以 分 类 ， 从 而 获得 了 有 关 当 地 
食品 消费 情况 的 准确 信息 ， 用 雷 兹 的 话说 :“ 垃 圾 决 不 会 说 谎 和 和 弄虚作假， 什么 样 的 人 丢 什 么 样 的 垃圾 。” 
雪 佛 隆 公司 借 此 做 出 相应 的 决策 ， 大 获 全 胜 ， 而 其 竞争 对 手 却 始终 没有 搞 清 雪 佛 隆 公司 的 情报 来 源 。 
资料 来 源 ， 陈 明 杰 . 市 场 调查 奇 招 多 [中]. 现代 企业 ，1995 (12). 


以 上 的 案例 资料 说 明 ， 训 查 研究 是 经 营 决策 的 前 所， 只 有 区 充分 准确 的 信息 才能 做 
出 科学 的 分 析 判断 ， 决 策 才 具有 针对 性 。 那 么 ， 我 们 应 如 着 展 统计 调查 活动 ， 以 获得 丰 
实 、 可 村 的 数据 史 ? 醒 第 一 节 交 会 为 大 家 介 骨 统计 集 方法 。 


i 






姓氏 是 一 种 标记 。 在 生物 学 研究 上 > apes tee 关于 姓氏 的 研究 ， 表 面 
上 看 起 来 是 一 门 边缘 学 科 ， 灾 际 让 是 伯 四 优秀 的 文化 半 记 ,NI 姓氏 反映 了 中 国 社会 几 千年 进化 
的 痕迹 与 传递 的 过 程 。 Nx 

1982 年 ， A 此 次 普查 的 相关 抽样 数据 被 统计 出 来 。 国 家 统 
计 部 门 根据 相关 的 资料 数据 ， 开始 对 我 国 的 妈 层 二 i 研究 。1987 年 ， 统 计 出 中 国 的 姓氏 有 12000 一 
13000 个 。 同 年 科学 院 正在 进行 有 关 姓 氏 研 给 的 消息 被 一 些 媒 休 广 泛 传 播 。 1987 年 5 月 2 日 , 国 
家 统计 部 门将 此 次 姓氏 统计 中 排名 前 一 百 位 的 姓氏 公之于众 ， 被 称 为 “新 百 家 姓 "。“ 新 百 家 姓 ”中 ， 
“ 李 、 王 、 张 ”位 居 前 三 甲 。 

据 公 安 部 治安 管理 局 最 近 一 次 对 全 国 户籍 人 口 的 统计 分 析 显 示 : 截至 2015 年 ， 李 姓 是 我 国 第 一 大 
姓 ， 有 9530 万 人 ， 占 全 国人 口 总 数 的 7.94%， 也 就 是 说 每 13 个 人 中 就 有 一 个 人 姓 李 ， 就 
地 区 而 言 ， 李 姓 在 北方 诸 省 中 所 占 比 例 较 高 ， 一 般 在 8% 以 上 。 而 在 南方 诸 省 中 所 占 比例 
一 般 不 足 8 和 6; 尤其 在 东南 沿海 诸 省 中 。 比 例 仅 在 4% 左 右 第 二 大 姓 是 王 ， 有 8890 万 人 ， 
【拓展 知识 】 占 全 国人 口 总 数 的 7.41%; 第 三 位 是 张 姓 ， 有 8480 万 人 ， 占 全 国人 口 总 数 的 7.07%。 

资料 来 源 ， 中 华 统计 学 习 网 -新 京 报 . 








给 出 本 案例 的 目的 在 于 使 读者 对 本 章 所 讲 的 “统计 数据 的 收集 和 整理 ”有 一 种 具体 的 
认识 。 在 这 里 ,读者 看 到 了 数据 采集 和 数据 录入 的 基本 程序 ， 从 而 明了 数据 的 来 源 。 








第 1 章 介 绍 了 获取 数据 的 方法 主要 有 两 种 ,一 是 统计 调查 ,二 是 科学 实验 。 而 取得 反 
映 社会 经 济 现象 总 体 数量 全 部 或 部 分 信息 的 数据 资料 ， 统计 调查 方式 最 为 常用 。 统 计 调查 


第 2 章 

统计 数据 的 收集 、 整 理 与 显示 

就 是 按照 统计 研究 的 任务 ， 运 用 科学 的 统计 调查 方法 ， 有 计划 、 织 地 向 客观 实际 搜集 

a tt we 

节 。 统 计 调查 的 基本 要 求 是 准确 性 和 及 时 性 。 进 行 统计 调查 工作 ， 应 拟订 统计 调查 方案 ， 

以 确定 统计 调查 的 目的 、 调 查 的 对 象 、 调 查 的 项 目 等 内 容 。 实 际 工作 中 常用 的 统计 调查 方 
式 有 普查 、 重 点 调查 、 典 型 调查 、 抽 样 调查 和 统计 报表 等 。 


@ 阅读 案例 2 一 1 
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吉 列 公司 的 统计 调查 


男人 长 胡子 ， 因 而 要 刊 胡 子 ; 女人 不 长 胡子 ,自然 也 就 不 必 徘 胡子 。 然 而 ， 美国 的 吉 列 公司 却 把 


刊 胡 刀 ”推销 给 女人 ,居然 大 获 成 功 。 ,人 

吉 列 公司 创建 于 1901 年 其 产品 因 使 男人 各 胡子 变 得 方便 、 而 大 受 欢迎 。 进 入 20 世 
纪 70 年 代 ， 吉 列 公司 的 销售 额 已 达 20 亿美 元 ， 成 为 世界 著名 FANS 然而 吉 列 公司 的 领导 者 并 
不 以 北江 中 而 是 想方设法 继续 拓展 市 场 ， 争取 更 多 用 户 。 Me) ， 公 司 提出 了 面向 妇女 的 专用 

I Ce 
一 决策 着 似 花 课 ， 却 是 建立 在 坚实 可 千 的 续 庆 内 于 础 之 上 的 。 

二 一 年 的 时 间 进 行 了 周密 的 市 饭 A 有 65% 的 人 为 
保持 美好 形象 ， 要 定期 乔 除 服 毛 和 腋毛 。 AR 中 ， 除 使 用 电动 天明 刀 和 脱毛 剂 之 外 ， 主要 靠 购买 
各 种 男 用 刊 胡 刀 来 满足 此 项 需要 ， ee 。 相 比 之 下 ,美国 妇女 一 年 花 在 
i 全 个 极 有 潜力 的 市 场 。 

根据 调查 结果 ， 吉 列 公司 精心 设计 了 新 产品 ， 它 的 刀 采用 一 人 
用 的 双 层 刀片 ， 得 是 刀 困 则 过 | 选用 了 色彩 鲜艳 的 塑料 eprint 握 柄 上 还 
了 一 休 维 萄 图案。 这 稀 飞 趟 ， 新 产品 立即 显示 区 怪 的 将 

为 了 使 锥 旭 时 刀 攻 过 点 令 市场， a 到 消费 者 之 中 征求 意见 。 
这 些 定位 观念 包 播 } 突出 刊 毛 刀 的 “ 双 刀 刊 毛 ” 突出 其 创造 性 的 “完全 适合 女性 需求 "， 强调 价格 的 
“不 到 50 美 分 ”; 表明 产品 使 用 安全 的 “不 伤 玉 腿 "， 等 等 。 

最 后 ， 公 司 根据 多 数 妇女 的 意见 ， 选 择 了 “不 伤 玉 妥 ”作为 推销 时 突出 的 重点 ， 刊 登 广告 进行 刻意 
宣传 。 结 果 ， 锥 菊 刊 毛 刀 一 炮 打 响 ， 迅 速 畅销 全 球 。 


2.1.1 统计 调查 方案 的 确定 

在 通过 统计 调查 统计 数据 之 前 ,需要 制订 出 一 个 周密 、 完 整 的 调查 方案 ,以 指导 整个 
调查 工作 。 一 个 完整 的 统计 调查 方案 应 包括 以 下 内 容 : 

1. 确定 调查 目的 

在 调查 方案 中 首先 应 明确 本 次 调查 的 目的 , 它 要 回答 的 是 为 什么 要 调查 .要 解决 什么 
样 的 问题 。 只 有 这 些 问题 明确 之 后 ,才能 确定 向 谁 调查 ,调查 什么 及 采用 什么 方法 进行 
调查 。 

2. 确定 调查 对 象 和 调查 单位 

调查 对 象 和 调查 单位 要 解决 的 是 向 谁 调查 ,由 谁 来 提供 所 需 资 料 的 问题 。 调 查 对 象 是 
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根据 调查 目的 确定 的 调查 研究 的 总 体 或 调查 范围 ， 调 查 单位 是 构成 调查 对 象 的 每 一 个 音 
位 ， 是 调查 项 目 和 指标 的 承担 者 或 载体 。 例 如 ,《 农 产量 抽样 调查 制度 》 是 国家 统计 局 为 
取得 高 质量 的 农产品 产量 等 相关 指标 数据 ， 在 全 国 范围 内 统一 抽 选 样本 调查 、 推 算 ， 并 由 
直属 调查 队伍 实施 的 抽样 调查 制度 。2003 年 全 国共 抽 选 了 约 13 万 个 样本 地 块 进行 实 割 实 
测 调查 ， 并 运用 这 些 样本 科学 地 推算 全 国 粮 食 产量 数据 。 
根据 调查 目的 、 调 查 对 象 、 调 查 单位 的 概念 ， 我 们 可 以 分 析 得 出 ， 此 项 调查 的 调查 目 
的 为 国家 统计 局 为 取得 高 质量 的 农产品 产量 等 相关 指标 数据 : 调查 对 象 为 全 国 所 有 农业 
地 ; 调查 单位 为 所 抽取 的 13 万 个 样本 中 的 每 一 个 个 体 。 
3. 设计 调查 项 目 和 调查 表 

调查 项 目 是 调查 的 具体 内 容 ， 它 要 回答 的 是 调查 什么 问题 。 调查 项 目 可 以 是 调查 单位 
的 数量 特征 ， 也 可 以 是 调查 单位 的 某 种 属性 或 品质 特征 。 洞 丰硕 且 弟 以 表格 的 形式 来 表 
现 ， 称 为 调查 表 。 CAN 

4. 方案 设计 中 的 其 他 内 容 , 兴 |- 


另外 ,调查 方案 还 应 明确 调查 所 采用 的 方式 种 恩 法 、 调查 时 间 、 调 查 的 组 织 与 实施 工 
作 等 。 调 查 时 间 包 括 调查 数据 的 所 属 时 间 《 阁 为 时 点 现象 ， 要 明确 规定 资料 的 统一 时 点 ， 
即 标准 时 点 ， 若 为 时 期 现象 要 明确 规定 现象 的 起 止 时 间 ) 和 调查 的 工作 期 限 指 调查 工 
国 感 济 回 。 作 从 开始 到 结束 的 时 间 长 诬 ， 包 括 调查 人 员 的 选择 、 组 织 的 培训 ， 调 查 经 费 
E l 的 玉 源 和 开支 基 算 等 以 及 调查 表格 、 问卷 % 油 查 员 手册 的 印刷 等 )。 例 如 ， 
加 只 此 。 2010 年 我 国 第 六 次 入口 普 查 规定 :的 调查 数据 的 所 属 时 间 为 “2010 年 11 月 1 
[天 改过 他 1 目 0 时 o5 渐 查 的 十 作 期 限 是 “20t0 年 3 月 1 日 至 11 月 10 日 完成 普查 的 全 


记 工 作 ”。 DA AS 
a 


2.1.2 党 用 测 统 计 调 检 方法 分 





















































1. 普查 

普查 是 专门 组 织 的 一 般 用 来 调查 属于 一 定时 点 上 社会 经 济 现象 数量 的 全 面 调查 ， 它 是 
针对 有 限 总 体 而 言 的 。 普 查 比 其 他 任何 一 种 调查 都 更 能 掌握 全 面 、 系 统 的 国情 、 国 力 的 基 
本 统计 资料 。 

普查 通常 是 一 次 性 的 或 周期 性 的 ， 一 般 需 要 规定 统一 的 标准 调查 时 间 。 目 的 是 避免 
调查 数据 的 重复 或 遗漏 。 普 查 所 采用 的 方式 是 利用 基层 单位 原始 记录 和 核算 资料 发 表 调 
查 。 由 于 普查 的 工作 量 大 、 时 间 性 强 、 需 要 大 量 的 人 力 和 财力 ， 因此 普查 的 使 用 范围 比 
































国 手 回 为 了 摘 清 、 掌 握 重 大 国情 、 国 力 、 基 本 情况 而 专门 组 织 的 普查 ,我 国 已 
注 哈 各 。 经 实施 过 的 有 人 口 普查 、 基 本 单位 普查 、 工 业 普查 、 农 业 普查 、 第 三 产业 普 
i 查 和 经 济 普查 等 。 例 如 ， 我 国 第 六 次 人 口 普查 时 间 规定 2010 年 11 月 1 日 零 


【拓展 视频 】 ”时 为 标准 时 点 。 
普查 为 各 级 政府 制定 国民 经 济 和 社会 发 展 规划 、 出 台 政 策 措施 等 提供 参考 依据 ， 也 是 
其 他 统计 调查 方法 顺利 开展 的 基础 .为 其 他 调查 确定 调查 范围 等 提供 原始 资料 。 
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普查 及 种 类 


普查 是 指 一 个 国家 或 一 个 地 区 为 详细 地 了 解 菜 项 重要 的 国情 、 国 力 和 市 情 、 市 力 而 专门 组 织 的 一 次 
性 、 大 规模 的 全 面 调查 ， 其 主要 是 用 来 收集 某 些 不 能 够 或 不 适宜 用 定期 的 全 面 调查 报表 收集 的 信息 资料 。 
按照 国务 院 规定 ， 我 国 所 进行 的 普查 主要 有 人 口 普查 、 农 业 普 查 、 工 业 普查 、 第 三 产业 普查 、 基 本 单位 
普查 等 。 其 中 ， 人 口 普查 、 第 三 产业 普查 、 工 业 普查 、 农 业 普查 每 隔 10 年 进行 一 次 ， 分 别 在 闫 0、3、5、 
7 的 年 份 进行 ， 基 本 单位 普查 ， 每 晤 5 年 进行 一 次 ， 在 连 1、6 的 年 份 进行。 

2003 年 6 月 份 经 国务 院 批准 ， 国 家 统计 局 印发 了 《关于 推迟 第 二 次 三 产 普查 并 调整 其 他 普查 项 目 和 
周期 的 意见 》 通 知 ， 提 出 调整 今后 所 有 普查 的 项 目 设置 和 周期 意见 。 其 主要 内 容 如 下 ， 

(1) 经 济 普查 。 将 定 于 2003 年 进行 的 全 国 第 三 产业 普查 和 计划 于 20605 肖 2006 年 分 别 进行 的 工业 
普查 和 基本 单位 普查 合并 ， 同 时 将 建筑 业 纳入 普查 内 容 ， A ( 即 非 农 产业 普查 )。 于 2004 
年 开展 第 一 次 全 国 经 济 普查 。 经 济 普查 以 企 事业 单位 、 机 关 人 和 工商 户 为 对 象 ， 主 要 普查 第 二 、 
三 产业 的 发 展 变化 情况 。 该 项 普查 以 后 每 10 年 进行 两 次 , / 符 利 汪 、j8 的 年 份 实施 。 

(2) 农业 普查 。 以 从 事 农 、 林 、 软 、 主 业 活动 的 间 认 和 为 对 象 ， 主 要 普查 第 一 产业 的 发 展 变化 
情况 。 每 10 年 进行 一 次 ， 在 过 6 的 年 份 实施 。 > 

(3) 人 口 普查 。 以 自然 人 为 对 稍 ， 主 要 着 Ts 
一 次 ， 在 过 0 的 年 份 实施 。 A a 

记 束 后 的 名 项 普查 的 项 目 设 置 和 局 关 安 兽 虽 加 大 学 、 合理 ， 进 尖 四 加 强 了 周期 性 普查 和 经 常 性 拍 样 
调查 的 相互 配套 ， 更 好 地 适应 国家 扩 国 民 每 济 和 社会 发 展 -先知 和 五 年 计 划 的 时 间 要 求 。 

资料 来 源 ， 天 津 统计 信 网 hftps //www. stats — tj. gO en 

2. 重点 调查 2 人 | SN 

CS > 

re nt ore brn ne dh 
的 一 种 非 全 面 调查 。 所 谓 重点 单位 ， 是 指 在 总 体 中 有 举足轻重 地 位 的 单位 ， 其 所 要 调查 的 
数量 特征 值 在 总 体 的 特征 值 总 量 中 占有 较 大 比重 ， 能 保证 有 足够 的 代表 性 。 重 点 调查 的 特 
点 是 省 时 、 省 力 ， 对 重点 单位 的 选择 不 带 有 主观 性 。 

重点 调查 的 日 的 是 反映 经 济 现象 的 基本 情况 。 一 般 来 说 ， 当 调查 任务 只 要 求 掌 握 基本 
情况 ， 而 调查 的 部 分 单位 又 能 达到 对 基本 情况 的 掌握 ， 即 能 比较 集中 地 反映 所 研究 的 项 目 
和 指标 时 ， 采 用 重点 调查 比较 适宜 。 例 如 ， 要 了 解 我 国 棉花 生产 的 一 般 情 况 ， 不 需要 对 全 
国 的 棉田 一 一 进行 调查 ， 只 需要 调查 一 些 棉花 集中 产 区 的 生产 情况 ， 如 河南 省 、 山 东 省 、 
新 疆 等 ， 因 这 些 集中 产 区 所 产 棉花 在 全 国 棉花 产量 中 占有 很 大 比例 。 
重点 调查 通常 用 于 不 定期 的 一 次 性 调查 ,如 专门 设计 和 配备 人 员 到 现场 调查 。 但 有 时 
也 用 于 经 常 性 的 连续 调查 ， 如 同 报表 制度 结合 ， 通过 统计 报表 调查 。 

3. 典型 调查 

典型 调查 是 根据 调查 目的 和 要 求 ， 在 对 研究 对 象 进行 全 面 分 析 的 基础 上 ， 有 意识 地 选 
择 部 分 有 代表 性 单位 进行 调查 ， 它 是 一 种 非 全 面 调查 。 典 型 调查 的 特点 是 调查 范围 小 、 调 
查 单位 少 、 具 体 深 入 、 节 省 人 力 、 物 力 和 财力 ， 对 典型 单位 的 选择 带 有 主观 性 ， 即 有 意识 
地 进行 调查 单位 的 选择 ， 它 更 多 地 取决 于 调查 者 的 主观 判断 与 决策 。 
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典型 调查 是 为 研究 某 种 特殊 的 社会 经 济 问题 搜集 详细 的 第 一 手 资料 ， 借 以 认识 事物 
的 本 质 特 征 、 因 果 关 系 、 变 化 趋势 .为 理论 和 政策 性 问题 研究 提供 依据 。 其 目的 在 于 总 

结 先进 的 经 验 和 落后 的 教训 。 因 此 ， 若 研究 的 目的 是 推广 先进 经 验 或 为 吸取 落后 的 教训 
时 ， 可 选择 典型 调查 的 方法 进行 。 选 择 典型 单位 时 ， 在 研究 总 体 构成 不 是 很 复杂 的 情况 
下 ， 可 直接 选择 典型 单位 进行 ; 若 研究 的 总 体 比 较 复 杂 ， 则 可 运用 划 类 选 典 的 方法 进 
行 ， 即 将 调查 总 体 划分 为 若干 类 ， 青 从 每 类 中 选择 若干 个 典型 进行 调查 ， 以 说 明 各 类 的 
情况 。 
典型 调查 的 不 足 是 在 实际 操作 中 选择 真正 有 代表 性 的 典型 单位 比较 困难 ， 而 且 容 易 受 
人 为 因素 的 干扰 ， 从 而 可 能 导致 调查 结论 有 一 定 的 倾向 性 。 


同 风 国生 国 装 1 
重点 调查 与 典型 调查 的 区 别 与 nema 


和 取 的 部 分 单位 进行 调查 。 























区 别 : 四 调查 单位 选取 的 方式 不 同 。 重 点 单位 要 选取 其 数 征 值 在 总 体 的 特征 值 总 量 中 占有 较 大 
比例 的 单位 ， 使 其 能 保证 有 足够 的 代表 性 ， 具 有 客观 性 惟 柚 位 则 是 有 意识 地 选取 部 分 有 代表 性 的 
单位 ， 单 位 的 选择 带 有 主观 性 。 ed ed 而 典型 
调查 的 目的 是 推广 先 为 吸取 落后 教训 / 

a a AS ni 

4. 抽样 调查 AN SR 
回国 抽检 检讨 机 村- 秀 轨 前 位 作为 本 进香， 并 根 
二 据 调查 结果 来 推断 总 体 数 量 特征 的 二 视 非 全 面 调查 。 抽 样 调查 的 优越 性 表现 
i 在 它 的 经 济 性 、 灵 活性 、 时 效 性 强 以 及 适应 面 广 和 准确 性 高 上 。 

[5 民 因 训 】  、 广 措 宕 调查 主要 用 于 调查 开 首 莽 大 、 没 条 件 或 没 必要 进行 全 面 调查 及 破坏 

锥 等 情况 。 抽 样 调查 必须 遵循 以 下 原则 ，@ 随 机 原则 。 所 谓 随机 原则 ， 
就 是 要 使 所 有 调查 单位 被 抽 到 的 可 能 性 相同 。 只 有 这 样 ， 才 能 保证 所 抽取 的 样本 对 总 体 具 
有 较 大 的 代表 性 四 最 大 抽样 效果 原则 。 所 谓 最 大 抽样 效果 原则 ， 就 是 在 既定 的 调查 费用 
下 使 抽样 估计 误差 尽 可 能 小 ;或 者 是 在 给 定 的 精确 度 下 ， 使 调查 发 用 尽 可 能 小 。 一 般 说 
来 ， 节 省 调查 费用 和 提高 抽样 调查 结果 的 精确 度 的 要 求 往往 是 矛盾 的 ， 抽 样 误差 要 求 越 
小 ,调查 费用 要 求 就 越 大 。 在 实际 操作 时 ， 经 常 使 用 的 方法 是 要 求 在 给 定 的 误差 下 ,选择 
调查 费用 最 省 的 抽样 设计 方案 。 

抽样 调查 是 一 种 科学 、 可 靠 的 调查 统计 方法 ， 抽 样 调查 所 取得 的 数据 就 是 用 来 推断 或 
代表 总 体 的 。 抽 样 调查 与 其 他 非 全 面 调查 相 比 具 有 以 下 特点 

第 一 抽样 调查 从 总 体 中 抽 选 出 来 进行 调查 并 用 以 推断 总 体 的 调查 样本 ， 是 按照 随机 
原则 抽 选 出 来 的 ， 由 于 不 受 任何 主观 意图 的 影响 ， 因 此 总 体 中 各 个 单位 都 有 被 抽 中 的 可 能 
性 ， 能 够 保证 被 抽 中 的 调查 样本 在 总 体 中 的 合理 、 均 匀 分 布 ， 调 查 出 现 倾向 性 偏差 的 可 能 
性 是 极 小 的 ， 样 本 对 总 体 的 代表 性 很 强 。 

第 二 ,抽样 调查 是 以 抽 选 出 的 全 部 调查 样本 作为 一 个 “代表 团 ”来 代表 总 体 的 ， 而 不 
是 用 随意 挑选 出 来 的 个 别 单位 来 代表 总 体 ， 使 调查 样本 具有 充分 的 代表 性 。 
第 三 ， 抽 样 调查 所 抽 选 的 调查 样本 数量 ， 是 根据 要 调查 的 总 体 各 个 单位 之 间 的 差异 程 
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度 和 调查 推断 总 体 允 许 的 误差 大 小 ， 经 过 科学 的 计算 确定 的 。 由 于 在 调查 样本 的 数量 上 有 
可 靠 的 保证 ， 样 本 就 会 与 总 体 实际 十 分 接近 。 回 起 癌 国 
第 四 ， 抽 样 调查 中 的 样本 误差 ， 在 调查 前 就 可 以 根据 调查 样本 数量 和 总 。 车 
体 中 各 单位 之 间 的 差异 程度 进行 计算 ,可 以 把 样本 误差 控制 在 一 定 范围 之 ” 国 
内 ,调查 结果 的 准确 程度 比较 有 把 握 。 【拓展 知识 】 
与 其 他 调查 一 样 ， 抽 样 调查 也 会 遇 到 调查 的 误差 和 偏 误 问 题 。 通 常 抽样 调查 的 误差 有 
两 种 : 一 种 是 工作 误差 (也 称 登 记 误 差 或 调查 误差 );， 另 一 种 是 代表 性 误差 (也 称 抽样 误 
差 )。 但 是 ， 抽 样 调查 可 以 通过 抽样 设计 、 计 算 并 采用 一 系列 科学 的 方法 ， 把 代表 性 误差 
控制 在 允许 的 范围 之 内 ; 另外， 由 于 调查 单位 少 ， 代 表 性 强 ， 所 需 调查 人 员 。 国 贡 加 
少 ， 工 作 误差 比 全 面 调查 要 小 。 特 别 是 在 总 体 包 括 的 调查 单位 较 多 的 情况 
下 ,抽样 调查 结果 的 准确 性 要 高 于 全 面 调查 。 因 此 ， 人 回 | 
的 ， 是 可 以 用 来 代表 总 体 的 。 【拓展 知识 】 
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表 2 -1 为 4 种 调查 方式 的 区 别 。 xy- 
表 2- 1 4 种 滴 查 方式 的 区 史 
调查 方式 LEY SN 、 调查 单 位 
反映 某 Wa > 名 济 现 象 的 状态 A 
普查 ~ | 
人 ft 





了 了解 衫 究 对 象 的 基本 情况 ， ry 选择 基 一 标志 值 在 总 体 标志 值 总 量 中 占 


于 二 天 村 。 | 等 交 体 相应 指标 有 较 大 比例 的 单位 作为 重点 单位 





Ne 


4 型 调查 
和 于 珊 才 :7 势 ， 可 以 近似 推算 总 体 数 量 


有 意识 的 选取 代表 性 单位 作为 典型 单位 





用 样本 指标 数值 推断 总 体 相应 指标 | “排除 主观 愿望 ， 按 随机 原则 抽取 样本 


抽样 调查 数值 单位 








人 pa 例 2-2 


统计 调查 帮助 A 公司 胜诉 


美国 的 A 公司 生产 著名 的 运动 包 , 该 公司 发 现 B 公 司 (一 个 大 型 的 中 心 商业 集团 ) 引进 一 条 生产 
线 ， 生产 的 运动 包 与 A 公司 的 运动 包 形状 几乎 完全 一 样 ， 消 费 者 很 难 区 分 。A 公司 指控 BB 公司, 说 B 公 
司 误导 消费 者 ， 让 消费 者 觉得 自己 购买 的 是 A 公司 的 产品 ,而 实际 买 的 是 BB 公司 的 产品 。 为 了 证 实 这 一 
点 ， 由 第 三 方 进行 了 一 次 现场 试验 。 实 验 者 选择 了 两 组 妇女 ， 给 第 一 组 妇女 看 的 是 A 公司 生产 的 包 ， 包 
面 上 所 有 标签 都 去 掉 ， 所 有 的 标识 、 说 明 都 印 在 包 的 内 层 。 给 第 二 组 妇女 看 的 是 也 公司 生产 的 包 ， 包 上 
的 商标 明显 可 见 ， 所 有 的 标签 和 号 挂 物 都 按 出 售 现场 的 样子 保留 。 这 样 做 的 目的 是 希望 通过 这 种 实验 了 
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解 妇女 们 购买 包 时 的 选择 标准 。 例 如 ， 她 们 能 否 区 分 出 包 的 不 同 来 源 或 品牌 ， 她 们 依据 什么 进行 识别 或 
辨认 ， 如 果 靠 某 些 东西 来 辨认 ， 那 么 这 样 做 的 理由 是 什么 。 

所 调查 的 两 组 妇女 都 是 200 人 ， 实 验 分 别 在 芝加哥 、 洛 杉 珊 和 纽约 的 大 型 商场 进行 调查 采用 拦 夫 
式 面 访 。 

实验 结果 表明 ， 大 多 数 消费 者 无 法 区 分 两 种 包 的 不 同 来 源 ， 她 们 购买 包 时 的 依据 主要 是 包 的 款式 ， 
而 A 公司 生产 的 包 是 名 牌 商品 ， 这 种 包 的 款式 是 人 们 所 熟悉 的 。 这 个 结果 支持 了 A 公司 的 立场 。 调 查 数 
据 帮助 A 公司 在 法 庭 上 胜诉 ，B 公司 同意 停止 销售 自己 公司 所 生产 的 包 。 

资料 来 源 : 页 俊平 ， 何 晓 群 ， 金 勇 进 ， 统计 学 [MJ]. 2 版 . 北京; 中国 人民 大 学 出 版 社 ，2005. 

5. 统计 报表 

统计 报表 是 按照 国家 有 关 法 规 的 规定 ， 自 上 而 下 地 乏 级 提供 基本 统计 数据 的 一 -种 调查 
方式 。 统 计 报 表 的 特点 是 由 政府 部 门 组 织 、 采 用 统一 的 表格 、 有 有恒 、 自 下 而 上 报 
告 。 统 计 报 表 是 一 种 具有 法 律 性 质 的 报表 。 

统计 报表 制度 是 建立 在 企业 的 各 项 原始 记录 基础 上 i 记录 是 基层 单位 通过 一 定 
A 计 报表 中 的 各 项 指标 是 以 企 
i A 量 直接 影响 到 报表 数字 资料 的 真 
实 性 和 可 靠 性 ， 应 充分 认识 其 在 企业 管理 中 DN 


统计 报表 的 种 类 主要 有 ， 
(1) 按 调查 范围 不 同 分 为 全 se 全 面 报表 要 求 调查 对 象 的 每 一 个 音 


位 都 填报 ， 而 非 全 面 报表 要 求 调查 的 一 部 分 单位 填报 、 
TO 
(3) 按 报 送 周期 长 旬 报 、 月 报 、 窑 报 半年 报 、 年 报 
(4) 按 报 送 单位 尔 同 分 为 基层 统计 报表 和 综合 统计 报表 。 

我 Mp , 已 建立 了 相当 稳固 、 扎 实 的 基础 。 


na 
统计 调查 方法 体系 


我 国 的 统计 调查 方法 体系 改革 的 目标 是 建立 以 必要 的 周期 性 普查 为 基础 ， 经 常 性 的 抽样 调查 为 主体 ， 
重点 调查 、 科 学 核算 等 为 补充 的 多 种 方法 综合 运用 的 统计 调查 方法 体系 。 

我 国 现行 的 以 全 面 调查 为 主 的 统计 调查 方法 体系 ， 是 按照 高 度 集中 的 计划 经 济 体制 和 分 级 管理 的 要 
求 建立 起 来 的 。 随 着 改革 开放 的 不 断 深入 ， 我 国 的 三 资 企 业 、 私 营 经 济 、 个 体 经 济 等 多 种 经 济 成 分 迅速 
发 展 ， 给 现行 的 统计 调查 工作 带 来 许多 新 的 问题 。 一 方面 ,统计 调 查 对 象 的 规模 迅猛 扩展 ; 另 一 方面 ， 
统计 调查 对 象 的 构成 日 趋 复杂 ， 不 仅 多 种 经 济 成 分 同时 并 存 ， 而 且 国 有 经 济 中 也 出 现 了 承包 经 营 、 租 任 
经 营 等 多 种 经 营 形式 ， 特 别 是 随 着 现代 企业 制度 的 建立 和 产权 的 流动 与 重组 ， 不 同 所 有 制 的 经 济 主体 投 
资 于 同一 企业 的 状况 日 趋 扩大 ， 混合 所 有 制 的 经 济 单位 越 来 越 多 。 由 于 利益 格局 的 变化 很 大 ， 被 调查 者 
对 统计 调查 的 合作 与 支持 程度 降低 ， 统 计 信 息 在 采集 过 程 中 的 人 为 干扰 现象 增多 ,信息 失真 的 风险 性 
增 大 。 

随 着 社会 主义 市 场 经 济 的 发 展 ， 固 守 一 种 调查 模式 , 仅仅 依靠 全 面 调查 一 种 方法 采集 统计 信息 ,已 
难以 适应 国家 宏观 调控 和 科学 决策 及 部 门 、 企 业 和 社会 公众 的 需要 。 为 了 从 根本 上 解决 调查 对 象 复 杂 、 
调查 方法 单一 的 问题 ， 国 家 统计 局 在 总 结 统计 调查 实践 经 验 的 基础 上 ， 按 照 社会 主义 市 场 经 济 的 要 求 ， 
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借鉴 国际 上 成 功 的 做 法 ， 对 历史 上 形成 的 传统 的 统计 调查 方法 体系 进行 了 一 系列 的 改革 ， 充实 和 完善 各 

项 普查 和 专项 调查 ,在 规模 以 下 工业 、 限 额 以 下 批发 零售 贸易 业 等 更 多 行业 和 领域 推广 抽样 调查 ,一 个 

符合 我 国 国情 的 、 适 应 市 场 经 济 发 展 需要 的 、 与 国际 通行 规则 接轨 的 新 的 统计 调查 体系 正在 逐步 形成 
资料 来 源 : 天 津 统计 信息 网 http: //www. stats tj. gov. cn. 


2.1.3 调查 问卷 设计 与 问卷 调查 表 的 编码 


回执 虞 回 
1. 调查 问卷 设计 
问卷 设计 是 统计 调查 的 一 项 重要 内 容 。 问 卷 设计 的 好 坏 直接 影响 到 数据 ” 国 


的 质量 和 分 析 的 结论 。 【拓展 案例 】 

1) 问卷 的 基本 结构 A 

问卷 是 调查 者 根据 调查 日 的 和 要 求 所 设计 的 ， 一 坡 才 由 开 甩 归 办 甄别 部 分 、 主 题 部 
分 和 背景 部 分 组 成 。 问 卷 的 设计 应 简明 扼要 ， 问题 应 通 价 身 居 ， 以 保证 所 收集 资料 的 准 
确 性 。 下 二 

(1) 开头 部 分 。 NNK 

在 自 填 式 问卷 中 ， 写 好 开头 部 分 (问候 谤 X 证 分 重要 ， 它 可 以 引起 被 调查 者 对 调查 的 
重视 ， 消 除 顾虑 ， 激 发 参与 意识 ， 以 争取 他 们 的 积极 合作 。 例 如 ， 下 面 是 一 份 “ 天 津 广播 
听众 调查 问卷 ”中 的 开头 部 分 : NN 三 


AN 、 % < 
先生 /女士 : 3 
您 好 ! 我 是 天 当 a 人 








一 项 有 关 广播 电台 收听 状况 的 调查 。 这 ; 目的 ， 主 要 是 了 解 我 市 听众 收听 天 津 人 
民 广播 电台 节目 的 二 在 基本 情况 ， 为 提高 第 量 、 推 出 优秀 节目 提供 科学 依据 。 

我 们 诚 慰 0 您 的 回答 对 天 津 人 民 广 播 电 
台 搞 好 广播 宣传 具有 非常 重要 的 意义 。 请 您 按 问 卷 的 要 求 ， 将 您 收听 天 津 人 民 广 播 电台 
节目 的 实际 情况 如 实 提供 给 我 们 。 您 的 回答 无 所 谓 对 错 ， 请 不 必 顾 虑 。 谢 谢 您 的 合作 ! 


(2) 甄别 部 分 。 

甄别 是 先 对 被 调查 者 进行 过 滤 ， 筛 选 掉 不 需要 的 部 分 ， 确 保 被 调查 者 合格 ， 能 够 作为 
该 调查 项 目的 代表 ， 从 而 符合 调查 研究 的 需要 。 例 如 , 下面 是 一 份 “天 津 广播 听众 调查 问 
卷 ” 中 的 甄别 部 分 : 





S1. 请 问 您 本 人 及 家 庭 成 员 中 ， 是否 有 在 下 列 单位 工作 的 成 员 [ 单 选 ] 
广告 公司 … 








032 





fy 
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S2. 请 问 您 的 年 龄 是 : 
20 岁 以 下 ER 
20 一 30 岁 … 
30 一 40 岁 … 
40 一 50 岁 

50 岁 以 上 本 
S3. 请 问 您 家 有 几 口 人 ? we 


an 





(3) 主体 部 分 。 

主体 部 分 是 调查 问卷 的 核心 内 容 ， 它 包括 了 所 要 调查 的 全 部 问题。 

(4) 背景 部 分 。 

背景 部 分 主要 是 有 关 被 调查 者 的 一 些 背 景 资 料 。 Wp ,东西 证 一 - 份 “ 天 津 广播 听众 调 


查 问 卷 ” 中 的 背景 部 分 : 


Fl. 年 龄 周岁 CA 


F3. 文化 程度 ; [ 单 选 ] RS 
小 学 及 以 下 .pp ea 


Sa 人 wo- 








机 关 事 业 单位 工作 人 员 及 公务 员 … 
企业 管理 人 员 (包括 经 理 、 人 
公司 职员 … aa 
专业 技术 人 员 (教师 、 医 生 、 护 士 、 合计 与 工程 和 具有 专业 技术 了 的 人 ) 
自由 职业 者 〈 包 括 律师 、 中 介 人 员 、 撰 稿 人 等 … a 
工人 (包括 各 类 企业 工人 、 不 包括 企业 内 退 、 病 退 人 员 … 
司机 … 

商业 、 饮 食 业 、 服 务 业 工 作 人 员 
私营 、 个 体 业 主 ee 
无 固定 工作 、 下 岗 待 业 人 员 …… 
离 退 体 人员 (已 领 退休 证 ， 有 退休 爹 的 人 ) 
内 退 、 病 退 人 员 ……… 
家 庭 主妇 ……pPp 。 
F5. 请 问 您 有 无 驾照 ? [ 单 选 ] 
有 … a 1 没有 2 
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2) 设立 问卷 问题 的 注意 事项 
(1) 提问 的 内 容 尽 可 能 短 。 
如 果 提 问 的 问题 太 长 不 仅 会 给 被 调查 者 的 理解 带 来 一 定 的 困难 ， 也 会 使 其 感到 大 
烦 ， 从 而 不 利于 对 问题 的 回答 。 若 问题 比较 复杂 ， 应 将 其 分 为 几 个 问题 来 问 。 
例如 ; “我国 越 来 越 多 的 人 去 国外 旅游 。 您 曾经 去 别 的 国家 旅游 过 吗 ? 如 果 去 过 
也 许 是 为 了 欣赏 风光 才 去 的 。 那么 ， 别 国 的 风光 对 您 决定 出 国旅 游 有 多 重要 ?” 
可 以 分 解 成 ， 
Q1; 您 出 国旅 游 过 吗 ? 1 一 是 ;2 一 否 (终止 访问 )。 
Q2: 那里 的 风光 对 您 决定 去 旅游 有 多 重要 ? 
(2) 问题 设计 的 用 词 要 准确 ， 用 语 要 含义 明确 。 
例如 ， 提 问 中 用 “最 "， 就 不 能 是 多 选 题 ， 这 是 用 词 不 当 。 再 如 ,“ 您 最 近 一 段 时 间 收 
听 过 广播 电台 节目 吗 ?",“ 最 近 ” 是 指 哪 段 时 间 ， 时 间 范围 不 明确 < 是 用 语 含义 不 明确 。 
(3) 在 问卷 中 的 问题 ， 必须 人 人 得 和 后 SN、 
例如 ， 基 单位 招聘 人 才 ， 问 题 是 ， 












































当 你 受挫 折 后 ， 你 的 反映 是 : a. 非常 肖 表 SR 不 全 到 b. 很 温 表 ， 
较 长 时 间 不 能 恢复 正常 情绪。c， 很 浊 吕 ,> 但 浪 快 能 恢复 正常 情结 。d. 越 失败 ， 直 受挫 


折 ， 越 想 再 干 。 SE 


结果 ， 绝 大 乡 数 应 股 者 部 洲 大 答案 , 过半 是 = 个 呈 然 得 不 到 该 实 辐 和 的 
问题 。 

(4 问题 的 不 同 提 半 可 能 导致 不 同 的 加 和 a 

例如 ， 当 你 问 菜 个 被 访 者 对 某 项 服务 的 满意 程度 时 ， 多 数 人 回答 是 70% ;而 当 你 用 同 
RE 多 数 人 回答 可 能 是 40% 或 50%， 
不 一 定 是 30% SN 

(5) 尽量 中 免 诱导 性 、 否 定性 和 敏感 性 问题 。 

例如 ,“ 专 家 们 都 认为 这 位 教师 讲课 不 错 ， 您 觉得 怎么 样 ?"， 这 就 是 诱导 性 问题 ;“ 您 
觉得 这 位 教师 的 讲课 不 好 吗 ?*， 这 就 是 否定 性 问题 ; “您 的 个 人 收入 是 多 少 ?"， 这 就 是 敏 
感性 问题 。 对 于 这 类 问题 ， 被 访 者 可 能 会 拒绝 回答 ， 或 者 不 诚实 回答 。 

3) 设立 问卷 答案 的 注意 事项 

Q) 对 单 选 问题 ， 备 选 答案 应 当 是 一 个 空间 的 完整 划分 。 例 如 ; 





您 对 这 个 部 门 的 服务 质量 是 否 满意 ? 
a. 非常 满意 b. 比较 满意 c. 一 般 d 不 太 满意 e. 不 满意 
这 5 个 答案 就 是 答案 空间 的 完整 划分 。 
(2) 对 单 选 问 题 ， 备 选 答案 不 应 当 是 两 个 空间 (层面 ) 的 混淆 。 


学 生 的 学 习 成 绩 好 .与 老师 的 关系 是 : 
a. 无 关 b. 老师 教 法 得 当 c. 老师 的 责任 心 强 d 老师 的 知识 渊博 
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这 里 给 出 的 4 个 备 选 答案 ， 就 是 两 个 层面 的 问题 。 学 生 的 学 习 成 绩 好 ， 与 老师 有 无 关 
是 一 个 层面 问题 (“关系 ”空间 的 问题 )， 而 老师 教 法 是 否 得 当 、 责 任 心 是 否 强 、 知 识 
否 渊博 是 另 一 个 层面 问题 (“态度 ”空间 的 问题 )。 把 它们 放 在 一 起 ， 作 为 单 选 题 的 备 选 
案 ， 是 不 正确 的 。 但 对 于 多 选 题 ， 备 选 答案 可 以 处 于 不 同 的 层面 。 

(3) 无 论 对 多 选 题 还 是 单 选 题 ， 任 何 一 个 备 选 答案 都 不 能 有 多 重 含义 。 例 如 





系 ， 
是 
答 








您 选择 这 份 工作 的 目的 是 : 
a. 自己 喜欢 ,收入 高 b. 没有 其 他 的 工作 可 选择 c.…… 


这 里 给 出 的 第 一 个 备 选 答案 本 身 就 包含 了 两 层 含义 ， 即 喜欢 与 收入 ， 选 择 该 答案 的 
人 ， 也 可 能 是 因为 喜欢 这 份 工作 ， 也 可 能 是 不 喜欢 但 由 于 其 收 状 高 而 选择 它 。 因此 ， 当 
你 统计 出 选择 该 答案 的 比例 时 ， 无 法 确定 到 底 有 多 大 比例 的 人 是 因为 喜 喜欢 而 选择 这 份 工 
作 ， 有 多 大 比例 的 人 是 因为 收入 高 而 选择 这 份 工作 。 因此 这 个 备 选 答案 的 设置 是 不 妥 
当 的 。 p 全 

(4) 无 论 对 多 选 题 还 是 单 选 题 ， 备 选 答 案 之 阳江 能 有 包含 关 系 。 例如 : 


您 选择 这 份 工作 的 目的 是 。 RY 
a. 没有 别 的 工作 可 供 选择 二 大 的 本 全 
SX 
选择 答案 a 的 ， 就 必然 全 所 择 竺 案 b， 既然 没有 蓝 的 条 作 可 供 选 择 ， 也 就 是 说 没有 别 
的 收入 来 源 ， 那 么 这 份 记 作 就 一 定 是 为 了 确保 全 家 民生 计 的 。 


回想 澡 回 # 冯 问卷 设计 的 基本 原则 ~ NS 
Se J 5D 主题 鲜明 。 ee 
回 AN 从 调查 的 主题 出 发 拟订 定 问 题 ， 使 提问 的 目的 明确 ， 重 点 突出 ， 没 有 可 


【拓展 知识 】 ”有 可 无 的 问题 。 

(2) 结构 合 

问卷 中 问题 的 安排 先后 必须 有 一 定 的 逻辑 顺序 ， 符 合 被 调查 者 的 思维 程序 。 在 等 题 的 
安排 上 应 该 先 封闭 后 开放 ， 先 易 后 难 。 

问卷 中 的 问卷 问题 一 般 可 以 分 为 两 类 : 一 类 是 封闭 性 问题 ， 另 一 类 是 开放 性 问题 。 封 
闭 性 问题 是 指 对 问题 事先 设计 好 了 各 种 可 能 的 答案 ， 由 被 调查 者 从 中 选择 。 封 闭 性 问题 方 
便 调 查 后 的 资料 整理 ， 但 是 对 一 些 比 较 复 杂 的 问题 ， 有 时 很 难 把 答案 设计 周全 。 因 此 ， 如 
何 设计 好 封闭 性 问题 的 答案 ， 是 问卷 设计 中 的 一 项 重要 内 容 。 开 放 性 问题 是 指 对 问题 的 回 
答 未 提供 任何 具体 的 答案 ， 由 被 调查 者 根据 自己 的 想法 自由 做 出 回答 。 例 如 ， 您 对 学 校 的 
教学 管理 有 何 更 具体 的 看 法 ? 这 就 是 一 个 开放 性 问题 。 开 放 性 问题 的 优点 是 被 调查 者 可 以 
充分 表达 自己 的 意见 和 想法 .缺点 是 给 调查 后 的 资料 整理 带 来 一 定 困 难 。 一 份 问卷 中 的 开 
放 性 问题 不 宜 过 多 ,而 且 开 放 性 问题 一 般 应 放 在 后 面 ,让 被 调查 者 有 一 定 的 思考 和 时 间 
否则 会 影响 被 调查 者 填写 问卷 的 积极 性 ， 从 而 影响 整个 问卷 的 回答 质量 

另外 ， 把 简单 的 、 容 易 回答 的 问题 放 在 问卷 的 前 面 ， 而 复杂 的 、 较 难 的 问题 放 在 问卷 
的 后 面 ， 使 被 调查 者 开始 时 感到 轻松 ， 有 兴趣 继续 回答 下 去 。 
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(3) 适当 控制 回答 时 间 。 

对 问卷 的 长 度 要 适当 控制 使 被 调查 者 回答 问卷 的 时 间 一般 不 要 超过 30 分 钟 ， 以 锡 
产生 厌烦 情绪 ， 从 而 数 衍 了 事 ， 影 响 调查 质量 。 

(4) 便于 计算 机 处 理 。 

间 卷 设计 要 考虑 易于 编码 、 录 入 、 汇 总 和 数据 出 表 等 处 理工 作 。 

2. 问卷 调查 表 的 编码 

问卷 调查 表 的 编码 主要 是 方便 数据 的 录入 、 整 理 和 分 析 。 

1) 单 选 题 问卷 调查 表 的 编码 

(1) 题 号 代号 不 能 重复 。 问 题 的 代号 必须 是 唯一 的 ， 不 可 以 重复 。 最 好 用 英文 字母 加 
数字 来 表示 。 为 方便 调查 资料 的 汇总 和 分 析 ， 问 题 的 代号 尽量 不 要 用 中 文字 。 

人 eR tt 
以 分 为 几 个 调查 表 米 设计 。 例 如 ， 调 查 学 生 的 道德 修养 水 平 的 月 成 情况 时 ， 可 以 将 一 份 问 
卷 分 成 3 个 表 来 设计 ， 即 表 1 一 父母 影响 表 ， 表 2 一 教师 行为 家 ， 表 3 一 学 生 自身 因素 表 。 
可 用 Ai, As， 0 te 用 Gi， 

… 作 为 表 3 中 问题 的 代号 。 

(3) 名 义 或 类 别 问题 的 代号 最 好 与 yee 以 3 一 5 个 英文 字母 简写 代表 最 
好 。 例 如 ， 年 龄 为 AGE， a YEAR 学 生性 别 为 SSEX， 教 育 程度 
为 EDU 等 。 

a 兹 > 

复 选 题 问卷 调查 表 ny 要 复杂 一 些 .下 面 表 2 -2 是 一 
份 简单 的 问卷 调查 表 : 


,< 表 2 3 河 蛤 洞 查 表 





























您 的 性 别 : 工 男 全 2 女生 
您 的 职务 : 1 主任 2 组 长 3 教师 





一 、 您 认为 目前 教改 阻力 来 自 哪些 单位 ? (可 复 选 ) 
1 教育 行政 单位 ”2 学 校 行政 人 员 3 家 长 团体 4 教师 本 身 5 其 他 团体 





、 您 认为 目前 教改 对 哪些 人 会 有 影响 ?( 可 复 选 ) 
1 教师 2 行政 人 员 3 学 生 4 其 他 





第 一 题 为 复 选 题 ， 内 设 5 个 选项 ， 可 用 5 个 代号 来 表示 ， 如 Ai ,Al ,Al ,Au,An。 
第 二 题 也 为 复 选 题 ， 内 设 4 个 选项 ， 可 用 4 个 代号 来 表示 ， 如 Azi ,As ,Azs ,Az。 
该 问卷 的 编码 可 做 如 表 2 - 3 所 示 设 计 。 
表 2-3 变量 编码 表 
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编码 表 说 明 : NUM 一 编码 ; SEX 一 性 别 ; JOB 一 职务 。 
An 一 Au 代表 第 一 题 中 5 个 选项 ， 选 中 者 输入 1， 未 选中 者 输入 0; Azi 一 Az 代表 第 
二 题 中 4 个 选项 ， 选 中 者 输入 1， 未 选中 者 输入 0。 


您 阅读 案例 2-3 





新 可 乐 的 开发 与 味 感 测试 问卷 调查 


这 是 发 生 在 20 世纪 80 年 代 上 半 叶 美国 的 故事 。1981 年 ， 可 口 可 乐 公司 为 了 加 强 对 百事 可 乐 (Pepsi 
Cola) 的 市 场 竞争 ， 拟 在 原 有 可 乐 品牌 的 基础 上 开发 出 一 种 较为 “平淡 柔软 ”的 新 可 乐 。 新 产品 开发 过 
程 历时 3 年 ， 研究 和 实验 了 许多 配方 ， 伴 以 一 轮 又 一 轮 的 产品 测试 。 前 后 共有 19 万 人 以 受 试 者 身份 参与 
味 感 测试 ， 这 些 人 分 布 在 美国 各 地 和 其 他 一 些 国家 。 这 些 测试 最 终 使 公司 芝 考 清国 信心 地 于 1985 年 
推出 了 名 为 “New Coke” 的 新 可 乐 ， 而 原 品 牌 就 相应 地 称 为 Wai a assic Coke) 。 

可 口 可 乐 公司 组 织 了 一 场 经 典 可 乐 、 新 可 乐 与 百事 可 乐 的 A 希望 能 够 找到 对 下 述 问 题 的 
答案 :消费 者 是 否 能 够 确实 区 分 新 可 乐 和 经 典 可 乐 ? rN 乐 的 味道 哪 一 个 更 招 人 喜欢 ? 大 


多 数 年 轻 人 是 否 更 喜欢 喝 甜 一 点 的 可 乐 ? 如 果 允 许 人 信物 一 听 可 乐 ， 他 们 是 否 会 选取 在 刚刚 的 


味 感 测试 中 属意 的 那个 品牌 ? 除 此 之 外 ， 还 有 其 他 所 些 待 回答 。 
相关 调 误 罕 一 闲 大 各 风物 中 心 的 古 沾 党 让 发、 用 配额 抽样 方法 取得 样本 。 测 试 遵照 “ 双 盲 原 
则 ”， 受 试 的 3 种 可 乐 分 布 标 上 “K”“L” Nh 无 论 现场 工作 人 员 还 是 受 试 者 都 不 知道 哪个 标签 


贴 到 哪个 品牌 上 。3 种 可 乐 两 两 搭配 ， ED 局、 K/M 和 L/M 三 各 组合。 在 实施 时 每 种 组 合 的 两 种 品 
牌 都 是 随机 排序 。 县 斌 者 每 多 完 一 条 和 都 得 用 清水 激 口 ， 然 F 一 种 可 乐 。 要 求 每 名 受 试 者 对 
每 一 组 合 给 出 其 喜欢 的 一 个 品牌 8“ X x 


次 人 一 rene 
enrol ren .dR 


1. 针对 下 列 每 v= 组 软饮料 组 合 ， 指 出 您 喜欢 的 一 个 。 
(1) 经 典 可 乐 (K) 或 新 可 乐 (L) 

(2) 新 可 乐 (L) 或 百事 可 乐 (MD) 

(3) 经 典 可 乐 (K) 或 百事 可 乐 (MD) 

2. 如 果 允 许 您 免费 取得 一 听 可 乐 ， 您 取 哪 一 种 ? 


应 答 人 序号 








(1) 新 可 乐 (2) 经 典 可 乐 (3) 百事 可 乐 
(4) 其 他 (5) 都 不 做 

3. 您 的 性 别 : 

(1) 女 (2) 男 

4. 您 家 户主 的 职业 是 : 

(1) 学 生 (2) 蓝领 (3) 白领 (4) 服务 业 职工 
(5) 家 庭 妇女 (6) 农民 

5. 您 最 后 的 学 历 是 : 

(1) 初中 (2) 高 中 未 毕业 (3) 高 中 毕业 

(4) 大 学 未 毕业 (5) 大 专 毕 业 (6) 本 科 毕 业 
(7) 研究 生 未 拿 学 位 (8) 硕士 或 博士 





6. 您 通常 每 周 饮用 几 听 可 乐 ? 
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7. 您 家 的 年 收入 是 : 


(1) 10000 美元 以 下 (2) 10000 一 不 足 15000 美元 

(3) 15000 一 不 足 25000 美元 (4) 25000 一 不 足 35000 美元 

(5) 35000 一 不 足 50000 美元 (6) 50000 美元 或 其 上 

8. 您 的 年 龄 : 

(1) 14 一 不 足 20 岁 (2) 20 一 不 足 25 岁 (3) 25 一 不 足 35 岁 
(4) 35 一 不 足 45 岁 (5) 45 一 不 足 55 岁 (6) 55 一 不 足 65 岁 
(7) 65 岁 或 其 上 

9. 您 的 种 族 : 

(1) 和 白 种 人 /高 加 索 人 (2) 黑 种 人 (3) 印度 人 

(4) 西班牙 裔 (5) 东方 人 (6) 其 他 ， 请 注 明 


本 次 调查 问卷 回收 有 效 问 卷 78 份 。 经 现场 审核 和 集中 审核 两 道 把 关 ， 确 认 无 误 。 交 录入 员 将 78 份 
问卷 的 答案 录入 计算 机 文件 。 表 2 -4 就 是 这 份 问卷 的 片段 。 


表 2 -4 调查 问卷 片段 《AN 
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~ 
~ 
~ 
~ 





资料 来 源 ，Donald S. Tull and Del I. Hawkins，Marketing Research: Measurement and Method, Mac- 
millan Publishing Company, New York, 1978. 


2.1.4 统计 数据 的 误差 


收集 统计 数据 是 统计 研究 的 第 一 步 ， 而 如 何 保证 统计 数据 的 质量 则 是 数据 收集 阶段 应 
重点 解决 的 问题 ， 因 为 统计 数据 质量 的 好 坏 直接 影响 到 统计 分 析 结 论 的 客观 性 与 真实 性 。 
为 确保 统计 数据 的 质量 ， 在 数据 的 收集 、 整 理 和 分 析 等 各 个 阶段 ， 都 应 尽 可 能 减少 误差 。 

统计 数据 的 误差 是 指 统计 数据 与 客观 现实 之 间 的 差距 。 研 究 统计 数据 误差 的 主要 目的 
是 找 出 导致 误差 产生 的 原因 ， 进 而 采取 对 策 避 免 、 减 少 误差 或 控制 误差 水 平 。 统 计数 据 误 
差 主 要 来 源 于 登记 性 误差 和 代表 性 误差 。 

1. 登记 性 误差 〈 非 抽样 误差 ) 

登记 性 误差 是 指 由 于 调查 者 或 被 调查 者 的 人 为 因素 所 造成 的 误差 。 无 论 是 采用 哪 种 调 
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查 方式 都 可 能 产生 登记 性 误差 。 调 查 者 所 造成 的 误差 主要 有 ， 调查 方案 中 有 关 的 规定 或 解 
释 不 明确 导致 的 填报 错误 ， 调 查 员 粗 心 。 在 记录 调查 结果 时 出 现 错误 ， 调 查 员 的 态度 、 情 
绪 及 责任 心 等 。 被 调查 者 所 造成 的 误差 主要 有 ， 不 理解 调查 方案 中 有 关 的 规定 或 解释 不 明 
确 导致 的 填报 错误 ; 因 人 为 因素 干扰 形成 的 有 意 虚报 或 螨 报 调查 数据 等 。 登 记性 误差 理论 
上 讲 是 可 以 消除 的 。 

2. 代表 性 误差 (抽样 误差 ) 

代表 性 误差 是 指 用 样本 数据 进行 推断 时 所 产生 的 误差 。 在 抽样 过 程 中 ， 我 们 依据 随机 
原则 抽取 样本 ， 可 能 抽 中 这 样 一 些 个 体 组 成 的 样本 ， 也 可 能 抽 中 另外 一 些 个 体 组 成 的 样 
本 。 根 据 不 同 的 样本 ， 可 以 得 到 不 同 的 观测 结果 。 例 如 ， 从 全 部 学 生 中 随机 抽取 20 人 组 
成 样本 并 计算 平均 体重 ， 由 样本 一 得 到 的 平均 体重 是 52. 35kg， 由 样本 二 得 到 的 平均 体重 
是 50. 26kg， 由 样本 三 得 到 的 平均 体重 是 53. 19kg。3 组 不 同 的 共 洒 得 到 不 同 的 结果 ， 但 
是 我 们 知道 ， 总 体 直 实 的 结果 只 有 一 个 ， 尽 管 这 个 真实 的 结 保 我 们 不 知道 。 

代表 性 误差 并 不 是 针对 某 个 具体 样本 的 检测 结 A 它 描述 
的 是 所 有 样本 可 能 的 结果 与 总 体 真 值 之 间 的 平均 

Ts 


出 丙 国 四 国 同 ……… 















































SN 
代表 性 误差 的 大 小 sr 最 明显 的 是 样本 蝇 的 天 不 各 体 的 离散 程度 的 高 低 。 四 样 
本 容量 越 大 ， 代 表 性 误差 就 越 小 了 但 混 样 本 容量 大 ， 就 意 红 滋 绩 消 耗 更 多 的 人 力 、 物 力 和 财力 ， 所 以 一 
味 地 筷 求 较 小 的 代表 性 误差 so we 即 总 体 中 各 个 体 之 
间 的 差异 越 大 ， 地 样 这 也 吉大 。 i 别 大 或 特别 小 的 个 体 ， 从 而 使 样本 结果 偏 大 或 


2.2 统计 数据 的 整理 


统计 数据 的 整理 是 将 收集 到 的 各 种 原始 数据 条 理化 、 系 统 化 ， 使 之 符合 统计 分 析 与 推 
断 要 求 。 统 计数 据 整 理 的 中 心 任务 就 是 分 组 和 编制 频数 分 布 表 。 


2.2.1 统计 数据 分 组 


统计 数据 分 组 就 是 根据 统计 研究 的 需要 ， 将 统计 数据 按照 一 定 的 标志 划分 为 若干 组 成 
部 分 的 一 种 统计 方法 。 统 计数 据 分 组 是 对 统计 总 体 进行 的 一 种 定性 分 组 ， 是 统计 认识 客观 
事物 的 手段 。 通 过 对 社会 经 济 所 涉及 的 方面 进行 重点 的 分 组 ， 达 到 对 其 一 般 及 特殊 性 的 
认识 。 
统计 数据 分 组 的 标志 可 以 是 品质 标志 ， 也 可 以 是 数量 标志 。 通 过 分 组 ， 可 以 划分 现象 
的 类 型 、 说 明 现象 的 内 部 结构 、 揭 示 现 象 与 现象 之 间 的 依存 关系 。 在 统计 数据 分 组 过 程 
中 ,选择 什么 样 的 标志 就 会 形成 什么 样 的 分 组 体系 ， 且 分 组 标志 一 经 确定 ， 就 突出 了 总 体 
在 此 标志 下 的 性 质 差 异 ， 而 掩盖 了 总 体 在 其 他 标志 下 的 差异 。 所 以 ,根据 统计 研究 的 目 
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的 ,在 对 研究 对 象 进行 分 析 的 基础 上 ， 应 抓 住 具有 本 质 性 的 区 别 及 反映 现象 内 在 联系 的 标 
志 来 作为 分 组 的 标志 。 
1. 按 品质 标志 分 组 
按 品质 标志 分 组 就 是 按 事物 的 品质 特征 进行 分 组 。 由 于 品质 数据 是 用 文字 来 表现 的 ， 
2 -种 类 别 ， 因 此 对 品质 型 数据 主要 是 做 分 类 整理 。 例 如 ， 按 所 有 制 性 质 划 
分 ,我 国 的 经 济 类 型 可 以 分 为 国有 经 济 、 集 体 经 济 、 私 营 经 济 、 个 体 经 济 、 联 营 经 济 、 股 
份 制 名 站 商 投资 经 济 ， 以 及 港 、 澳 、 台 投资 经 济 8 组 。 
按 品 质 标志 分 组 ， 分 组 界限 明确 后 ， 分 组 方法 比较 简单 。 


2. 按 数量 标志 分 组 


按 数量 标志 分 组 就 是 按 事物 的 数量 特征 进行 分 组 。 由 于 数值 型 数据 表现 为 具体 的 数 
值 ， 因 此 对 数值 型 数据 主要 是 按照 数值 进行 分 组 。 例 如 ， 3 绩 的 分 组 ， 可 以 分 为 60 
分 以 下 、60 一 70 分 、70 一 80 分 、80 一 90 分 、 人 按 数量 标志 分 组 ， 在 选择 
分 组 标志 后 ， 还 要 合理 确定 各 组 的 界限 。 因 此 ， KM 按 数量 标志 分 组 
较为 复杂 。 
统计 中 按 数 量 标 志 分 组 的 方法 有 单项 式 Nom 

1) 单项 式 分 组 

gaxha let 这 种 分 组 方法 通常 只 适合 于 离散 变量 且 变 
量 值 较 少 的 情况 。 采 用 的 方法 是 必 be ce \ 进 行 升序 排列 ; 然后 
将 相同 的 变量 值 分 为 一 组 ; ee 提交 料 分 成 基于 级， 钢 则 ， 大 学 生 按 其 曾经 使 用 过 的 
手机 数 分 组 ， 可 以 分 为 六 个、 2 es 

【 例 2.1】 某 车 间 50 个 工人 看 管 机 床 人 台 如 下 


| 039 




















pe Ne 
6 A 2482%3 人 08456 和 2 


2634545235 

试 对 数据 进行 分 组 。 
解 : 由 于 机 器 台数 属于 离散 型 变量 ,因此 使 用 单项 式 分 组 方法 。 
首先 将 原始 资料 按 变量 值 升序 排列 如 下 : 


2222222222222 2 
3333333333 3 
4444444 4 4 1 

5 5 5 5 5 5 5 5 

6 6 6 6 6 6 


然后 将 相同 变量 值 分 为 一 组 ， 最 后 将 资料 分 成 若干 组 。 本 例 分 组 变量 值 为 2、3、14、 
5、6 五 个 。 

2) 组 距 式 分 组 

组 距 式 分 组 就 是 将 全 部 变量 值 依 次 划分 为 若干 区 间 ， 并 将 这 一 区 间 的 变量 值 作 为 一 
组 。 这 种 分 组 方法 通常 只 适合 于 连续 变量 或 虽 为 离散 变量 但 变量 值 较 多 的 情况 。 组 距 式 分 
组 的 关键 问题 是 分 组 数目 的 确定 和 组 距 的 确定 。 
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在 组 距 式 分 组 中 ,如 果 各 组 的 组 距 相等 则 称 为 等 距 分 组 :; 如 果 各 组 的 组 距 不 相等 则 称 
为 不 等 距 分 组 。 例如， 对 学 生成 绩 的 分 组 可 以 分 为 0 一 20 分 、20 一 40 分 、40 一 60 分 、 
60 一 80 分 、80 一 100 分 5 组 ， 就 是 等 距 分 组 ;而 对 人 口 年 龄 的 分 组 可 以 分 为 0 一 6 岁 〈 婴 
幼儿 组 )、7 一 17 岁 〈 少 年 儿童 组 ) 、18 一 59 岁 〈 中 青年 组 )、60 岁 及 以 上 (老年 组 ) 4 组 ， 
就 是 不 等 距 分 组 。 

一 般 来 说 ， 当 变量 值 的 变动 比较 均匀 时 ， 宜 采用 等 距 分 组 ， 便 于 进行 对 比分 析 ; 而 当 
变量 值 的 变动 很 不 均匀 ， 且 变动 幅度 大 时 ， 则 宜 采 用 不 等 距 分 组 。 对 于 不 等 距 分 组 的 组 数 
和 组 距 的 确定 ， 必 须 结 合 现象 的 性 质 特点 和 统计 研究 的 要 求全 面 考虑 。 

下 面 重点 介绍 等 距 分 组 的 基本 步骤 。 

第 一 ， 数 据 排序 。 

将 原始 数据 资料 按 变量 值 大 小 进行 升序 排列 。 

第 二 ,分 组 数目 的 确定 。 

数据 应 分 成 多 少 组 比较 合适 ， 通 常 与 数据 本 身 的 特点 Ce 由 于 分 组 的 目 
的 之 一 是 观察 数据 分 布 的 特征 ， nett 显示 数据 的 分 布 特征 和 规 
律 为 原则 。 组 数 太 少 会 使 数据 的 分 布 过 于 集中 NS 多 又 会 使 数据 的 分 布 过 于 分 散 ， 
这 样 不 便于 观察 数据 分 布 的 特征 和 规律 。 x 

有 具体 做 法 是 ， 首 先 根据 数据 个 数 ， 天体 定 所 分 组 数 。 最 好 使 每 组 所 包含 的 数据 个 
数 ， 平 均 不 少 于 4 或 5 个 。 这 里 向 大 党 gh 种 确定 组 数 的 经 验 公式 ， 仅 供 大 家 参考 。 这 
一 公式 是 美国 学 者 斯 特 吉 ;其 (H. .Aliges) 创 用 的 ， A 吉 斯 经 验 公 式 ， 即 


> (pl+3. 322lgN ~ (2-1) 


式 中 ,为 组 数 ; NN 为 你 中 的 个 体 数 ， 对 名 本 人 和信 了 后 为 汉人 外 根据 这 
一 公式 ， 可 以 得 出 表 - 5 所 示 的 组 数 参考 标准 、 


表 2-5 分 组 组 数 参考 表 















™ 15~24 25~44 45 一 89 90 一 179 180 一 359 





大 5 6 7 8 9 


第 三 ,组 距 的 确定 。 

组 距 的 大 小 与 组 数 的 多 少 是 相互 制约 的 ,它们 之 间 呈 反比 例 关系 。 组 距 越 大 ， 则 可 分 
的 组 就 越 少 ; 组 距 越 小 ， 则 可 分 的 组 就 越 多 。 

组 距 可 根据 全 部 数据 的 最 大 值 和 最 小 值 及 组 数 来 确定 ， 即 

组 距 王 (最 大 值 一 最 小 值 ) 二 组 数 





第 四 ,组 限 的 确定 。 

组 限 即 为 每 个 组 的 两 个 端点 数值 ， 分 别 为 上 限 和 下 限 。 上 限 是 各 组 的 最 大 变量 值 ， 下 
限 是 各 组 的 最 小 变量 值 。 组 限 的 选择 应 做 到 第 一 组 的 下 限 应 略 低 于 最 小 变量 值 ， 最 后 一 组 
的 上 限 应 高 于 最 大 变量 值 。 
对 于 离散 变量 和 连续 变量 ， 组 限 的 划分 是 不 同 的 。 对 于 离散 型 变量 ， 由 于 其 只 能 取 整 
数 ， 相 邻 组 的 上 、 下 限 可 以 不 重 毒 。 例 如 ， 某 研究 小 组 按 人 数 分 组 可 以 分 为 4 一 6 人 、7 一 
8 人 、9 一 10 人 等 组 。 对 于 连续 变量 ， 相 邻 两 组 的 组 限 应 重要 ， 即 上 一 组 的 上 限 同 时 也 是 
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统计 数据 的 收集 、 整 理 与 显示 
下 一 组 的 下 限 ， 用 “上 限 不 在 内 ”原则 解决 不 重 问题 ， 即 当 相 邻 两 组 的 上 、 下 限 重 和 到 时 ， 
恰好 等 于 某 一 组 上 限 的 变量 值 不 算 在 本 组 内 ， 而 计算 在 下 一 组 内 。 例 如 ， 男 人 的 身高 可 以 
分 为 140 一 160cm、160 一 180cm、180 一 200cm、200 一 220cm 等 组 ， 且 均 为 “ 左 闭 右 开 ” 
区 间 。 
当 变量 值 变动 范围 较 大 时 ,为 避免 组 数 过 多 ， 可 以 采用 开口 组 。 开 口 组 是 指 最 小 组 为 
ee 以 下 "”， 最 大 组 为 “…… 以 上 ”。 
各 组 的 组 距 也 是 一 个 组 的 上 限 与 下 限 之 差 。 
第 五 ， 组 中 值 的 确定 。 
数据 分 组 后 ,经 常用 组 中 值 来 反映 组 距 分 组 中 各 组 数据 的 一 般 水 平 。 组 中 值 是 上 、 下 
限 之 间 的 中 点 数值 ， 其 计算 公式 为 
组 中 值 =( 上 限 十 下 限 ) 二 2 
实际 工作 中 ,对 于 开口 组 的 组 中 值 ， mm 因 
此 ， 其 组 中 值 的 计算 公式 近似 为 
所 人 下限 二 人/2( 拓 上 限 ?下 人 有 邻 组 组 距 /2( 缺 下 限 ) 
用 组 中 值 来 代表 各 组 数据 的 一 般 水 平 ， 有 设 条 件 ， 即 各 组 数据 在 本 组 内 呈 均 匀 
分 布 。 ,KN 
【 例 2.2】 某 学 校 50 位 教师 某 月 的 位， 元 ) 资料 如 下 : 
2200,，2100,4640，4580， A 2980，4000，3560，2850 
3320，2470，3000， 2540; 301Q， ,3680，4500， 321GX3400， 3320 
4200，3780，3980， 3800 T4806, 3210, 2590, M400%3700, 2740 
3840，3400，4100:、 35501 4780，2600，4320 ii， 4300，3890 
3390，3300， 3500, 280， 4120， S040 wa 2790，3280 
试 对 数据 进行 分 组 。 a 
解 : 由 于 江 资 属于 连续 型 变量 ， 因此 采用 组 距 式 分 组 方法 。 
(1) 将 原始 资料 按 升序 进行 排列 结果 为 
2100，2200，2340，2470，2540，2590，2600，2740，2790，2850 
2980，3000，3040，3130，3210，3210，3280，3280，3300，3320 
3320，3350，3390，3400，3400，3500，3500，3560，3680，3700 
3780，3800，3840，3890，3900，3980， 4000，4080，4100，4120 
4200，4300，4320，4400，4450，4500，4580，4640，4780，4800 
(2) 计算 极 差 R。 


| om1 


























R= 最 大 值 一 最 小 值 =4800 一 2100 二 2700 

(3) 确定 组 数 和 组 距 。 由 斯 特 吉 斯 经 验 公式 

组 数 k==1 十 3. 3221gN 一 1 十 3. 322lg501 十 3. 322X1. 699z6. 644=z7; 

组 距 d 一 R 人 一 2700/7=:385.7。 

因此 ， 取 整数 组 距 d 一 400， 并 进行 等 距 分 组 。 

(4) 确定 组 限 。 

取 第 一 组 下 限 为 2050， 则 该 组 上 限 = 下 限 十 组 距 一 2050 十 400 王 2450， 由 此 得 到 7 个 
组 的 上 、 下 限 如 下 : 
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2050~ 2450、2450 ~ 2850、2850 ~ 3250、3250 ~ 3650、3650 ~ 4050、4050 ~ 4450、 
450~4850。 
(5) 计算 组 中 值 。 根 据 公 式 : 
组 中 值 =( 上 限 十 下 限 ) 二 2 
可 计算 出 7 个 组 的 组 中 值 依次 为 2250、2650、3050、3450、3850、4250、4650。 


(由 读 专栏 2 -3 


统计 分 组 


为 了 从 数量 方面 深入 地 研究 总 体 的 特征 ， 揭 示 统 计 总 体 中 的 矛盾 ， 需 要 进行 统计 分 组 。 

统计 分 组 是 根据 研究 的 目的 ， 按 照 一 定 的 标志 ， pn 

这 些 若干 部 分 中 的 每 一 个 部 分 就 称 为 一 个 “分 组 ”。 例如， rae 口 状况 时 ， 可 按 年 龄 这 
一 标志 将 人 口 区 分 为 不 同 重组 。 从 这 个 例子 可 以 看 出 ， 各 组 别 是 不 同 的 ， 而 每 个 组 中 人 
口 所 表现 的 年 龄 特征 是 相同 的 。 正 是 因为 这 个 特点 ， 统 计 耸 oo 
的 差异 。 通 过 分 组 ， 可 以 把 总 体 中 各 个 不 同性 质 的 单 NS 使 性 质 相同 的 单位 归 在 一 个 组 内 。 这 
样 才能 从 数量 方面 训 析 事物 ， 揭 示 事 物 内 部 的 联系 SS 研究 总 体 的 特征 ,认识 事物 的 本 质 及 规 
律 性 。 

统计 分 组 是 基本 统计 方法 之 一 ， ee 在 统计 调查 方案 中 必 
须 对 统计 分 组 做 出 具体 规定 ， 才 能 搜 足 分 组 需要 的 资 计 资 料 的 整理 的 任务 是 使 零散 资 


料 系统 化 ， 但 怎样 使 资料 系统 1 A 这 就 取 》 于 。 因 此 ， 在 取得 完整 、 正 确 的 

统计 资料 前 提 下 ， 统 计 分 组 的 优 田 是 决定 整个 统计 研究 成 败 敬 关 职 ， 它 直接 关系 到 统计 分 析 的 质量 ， 
目前 ， 统 计 工 作 中 常用 的 A 、 按 国民 经 济 行业 分 组 、 按 单位 隶属 关 

系 分 组 、 按 地 区 分 组 你 和 R= 次 产业 划分 sy 站 分 、 按 职业 分 类 等 ， 其 中 重要 的 分 组 都 有 全 


国 统一 的 分 类 标 淮 ( 、 上 
资料 来 源 :， 需 津 统计 信息 网 http: //www. stats 一 gov. cn. 


2.2.2 频数 分 布 


在 统计 分 组 的 基础 上 ， 将 总 体 中 所 有 的 个 体 按 某 一 标志 进行 归 类 排序 ， 称 为 频数 分 布 
或 次 数 分 布 。 频 数 分 布 是 统计 整理 的 一 种 重要 形式 ， 通 过 对 零乱 、 分 散 的 原始 数据 资料 进 
行 有 次 序 的 整理 ， 形 成 一 系列 反映 总 体 各 组 之 间 个 体 分 布 状况 的 数列 。 

1. 频数 与 频数 分 布 表 


频数 〈Frequency) 是 指 分 布 在 各 组 内 的 数据 个 数 ， 也 称 为 次 数 。 各 组 频数 与 全 部 频 
数 之 和 的 比值 称 为 频率 或 百分比 (Percentage)， 各 组 的 频率 大 于 0， 各 组 频率 的 总 和 等 于 1。 
把 各 组 及 其 相应 的 频数 全 部 列 出 ， 并 用 表格 的 形式 表现 出 来 就 是 频数 分 布 表 。 

由 于 统计 分 组 是 按照 统计 标志 进行 的 ， 因此， 频数 分 布 相应 的 也 有 品质 频数 分 布 和 变 
量 频数 分 布 两 种 。 

1) 品质 频数 分 布 

品质 频数 分 布 是 指 按照 品质 标志 进行 的 分 组 所 编制 的 频数 分 布 。 例 如 ， 某 单位 职工 按 
受 教育 程度 分 组 统计 ， 可 以 得 到 表 2- 6 所 示 的 频数 分 布 。 
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统计 数据 的 收集 、 整 理 与 显示 
表 2-6 职工 受 教育 程度 的 频数 分 布 表 
按 受 教育 程度 分 组 频数 /人 数 频率 /% 
小 学 1 6. 25 
初中 2 12. 50 
高 中 12. 50 
大 学 9 56. 25 
研究 生 2 12. 50 
合 计 16 100 








Oe 


表 2-7 职工 性 别 的 频数 分 布 表 《< 
按 性 别 分 组 频数 /人 数 ，- RN 频率 /% 
男 职工 253 RR 68.75 
NN 




















女 职工 DS 31.25 
合 计 、 《A Nsé8 100 
、 ON 
表 2-6 和 表 2-7 所 示 的 分 组 统计 频数 分 布 ， 都 属 玉 按 照 品质 标志 进行 的 分 组 所 编制 
分 布 NN » Ny 
的 频数 分 布 。 流 wX 人 久 


2) 变量 频数 分 布 \ ,WK 

室 呈 上 玫 分 证 和 让 全 村 去 进 和 的 分 从 人 的 示 数 分 市 。 变 呈 上 数 分 布 可 分 
为 单项 式 频数 分 训 和 组 距 式 频数 分 布 。 六 > 

Q) 单项 起 频数 分 布 。 单 项 式 频 数 分 布 是 指 每 一 组 只 有 一 个 值 进行 分 组 形成 的 频数 分 
布 。 分 组 后 统计 出 每 组 变量 出 现 的 次 数 ， 即 频数 ， 并 计算 各 个 变量 值 出 现 次 数 占 总 次 数 的 
比例 ， 即 频率 。 最 后 ， 按 变量 值 的 大 小 顺序 列 出 单项 式 变量 数列 ， 并 形成 频数 分 布 表 。 例 
如 ， 基 单位 职工 按 家 庭 人 口 分 组 统计 ， 可 以 得 到 如 表 2 - 8 所 示 的 频数 分 布 。 


表 2-8 职工 家 庭 人 口 的 频数 分 布 表 























按 家 庭 人 口 分 组 /人 频数 /职工 户 数 频率 /% 
1 7 7 
红 38 14.9 
3 105 41.2 
4 54 21.2 
5 31 1 
6 20 7.8 
合 计 255 100 
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(2) 组 距 式 频数 分 布 。 组 距 式 频数 分 布 是 指 按 组 距 式 分 组 形成 的 频数 分 布 。 分 组 后 仍 
然 要 统计 出 每 组 变量 出 现 的 次 数 ， 即 频数 ,并 计算 各 个 变量 值 出 现 次 数 占 总 次 数 的 比例 ， 
即 频 率 。 最 后 ， 按 各 组 组 限 的 大 小 顺序 列 出 组 距 式 变量 数列 ， 并 形成 频数 分 布 表 。 例 如 ， 
某 单 位 按 某 种 产品 的 销售 量 分 组 统计 ， 可 以 得 到 如 表 2- 9 所 示 的 频数 分 布 。 


表 2-9 某 种 产品 的 销售 量 的 频数 分 布 表 



































按 销售 量 分 组 / 台 频数 /天 数 频率 /2% 
140~150 4 3. 33 
150 一 160 9 7.50 
160 一 170 16 13. 33 
170 一 180 27 r KS 22. 50 
180~190 20 A XT 16. 67 
190~200 17 Jy 站 广 14. 17 
200 一 210 10 六 和 站 
210~220 闪 RS 6. 67 
220 一 230 SO J 3.33 
230~240 1 SN 5 站 4.17 
合 计 r 120 六 X 下 号 100 








表 2-9 所 未 二 天 数 人 和 下 式 类 外 从 
2 膝 计 妆 攻 和 时 计 频 站 分 


在 数据 整理 中 ， 我 们 除了 上 面 的 频数 和 频率 的 统计 之 外 ， 有 时 还 关心 各 有 序 类 别 或 
组 在 某 一 个 变量 值 以 上 或 以 下 的 频数 或 频率 。 例如， 在 统计 学 生成 绩 时 ,我 们 除了 统计 
学 生 在 各 个 分 数 段 的 人 数 和 百分比 之 外 , 还 经 常 关 心 学 生 在 某 一 分 数 以 上 或 以 下 的 人 
数 。 例如， 及 格 (60 分 以 上 ) 的 人 数 有 多 少 ? 及 格 的 人 数 占 总 人 数 的 比例 有 多 大 ? 不 
及 格 (60 分 以 下 ) 的 人 数 有 多 少 ? 不 及 格 的 人 数 占 总 人 数 的 比例 有 多 大 ? 这 些 统计 内 
容 就 是 有 关 的 累计 频数 和 累计 频率 统计 。 因 此 ， 我 们 有 必要 对 频数 分 布 表 的 内 容 加 以 
扩展 。 

(1) 累计 频数 (Cumulative Frequencies) 。 累 计 频 数 就 是 将 各 有 序 类 别 或 组 的 频数 逐 
级 累加 起 来 。 其 方法 分 为 向 上 累计 和 向 下 累积 两 种 ， 向 上 累计 是 从 变量 值 小 的 一 方向 变量 
值 大 的 一 方 累加 频数 ;向 下 累计 是 从 变量 值 大 的 一 方向 变量 值 小 的 一 方 累 加 频数 。 通 过 累 
计 频 数 ， 我 们 可 以 很 容易 看 出 某 一 类 别 〈 或 数值 ) 以 下 或 以 上 的 频数 之 和 。 

(2) 累计 频率 或 百分比 〈Cumnulative Percentages) 。 累 计 频 率 就 是 将 各 有 序 类 别 或 组 
的 频率 逐 级 累加 起 来 。 其 方法 也 分 为 为 向 上 累计 和 向 下 累计 两 种 。 例 如 ， 某 单位 按 某 种 产 
品 的 销售 量 分 组 统计 ， 可 以 得 到 如 表 2- 10 所 示 的 频数 分 布 。 
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表 2-10 某 种 产品 的 销售 量 的 频数 分 布 表 



























































频数 分 布 向 上 累计 向 下 累计 
按 销售 量 
分 组 / 台 频数 /天 数 频率 /% 累计 频数 累计 频率 累计 频数 累计 频率 
140 一 150 4 3.38 3.33 120 100 
150~160 9 7.50 13 10. 83 116 96. 67 
160~170 16 13. 33 29 24. 16 107 89.17 
170~180 27 22. 50 56 46. 66 91 75,. 84 
180~190 20 16. 67 76 63. 33 64 53. 34 
190 一 200 17 14. 17 93 775 0< 让 44 36. 67 
200~210 10 8.33 103 SS 3 | 27 22. 50 
210 一 220 8 6. 67 111N 让 50 17 14.17 
220~230 4 3.33 ~, 95. 83 9 7.50 
230~240 5 i 3 100 5 4.17 
合 计 120 IOK \ ’ < 

~ YY 


一 - 
7 gi 

在 表 2 -10 中 ， 由 向 上 昧 入 条 以 看 出 ， 某 种 涌 乱 有 有 98 天 销售 量 在 200 台 以 下 ， 占 所 

统计 天 数 120 天 2 鸭 了 个 5096， 由 向 下 有 计 科 民 光 出 ， 某 种 产品 有 27 天 销售 量 在 200 

台 以 上 ， 占 所 统计 天 数 -(120 天 ) 的 22. 8 也- 

上 『 1 


2.2.3 统计 表 与 统计 图 


统计 表 和 统计 图 是 数据 资料 整理 的 两 种 重要 显示 工具 。 运 用 统计 表 可 把 杂乱 的 数据 有 
条 理 地 组 织 在 一 张 简明 的 表格 内 ， 即 便于 计算 比较 ， 又 易于 发 现 错误 和 遗漏 。 运 用 统计 图 
可 把 数据 形象 、 直 观 地 显示 出 来 ， 使 人 们 在 短 时 间 内 获得 明晰 的 印象 。 正 确 地 编制 和 使 用 
统计 图 表 是 做 好 统计 分 析 的 最 基本 技能 。 

1. 统计 表 

统计 表 就 是 将 统计 调查 所 搜集 到 的 数据 资料 经 过 汇总 整理 后 ， 按 一 定 顺序 填 在 以 纵横 
交叉 的 线条 所 绘制 的 表格 内 。 

1) 统计 表 的 结构 

统计 表 的 形式 多 种 多 样 、 根 据 使 用 者 的 要 求 和 统计 数据 本 身 的 特点 . 我 们 可 以 绘制 形 
式 多 样 的 统计 表 。 

统计 表 的 结构 一 般 由 表 头 、 行 标题 、 列 标题 和 数字 资料 4 部 分 组 成 。 其 中 ， 表 头 应 放 
在 表 的 最 上 方 ， 它 说 明 的 是 统计 表 的 主要 内 容 ; 行 标题 和 列 标题 通常 安排 在 统计 表 的 第 一 
列 和 第 一 行 ， 它 所 表示 的 是 所 研究 问题 的 类 别名 称 和 变量 名 称 ; 数字 资料 列 在 行 标题 与 各 
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列 标题 的 交叉 处 。 此 外 ， 必 要 时 还 可 以 在 统计 表 的 下 方 加 上 表 外 附加 ， 主要 包括 资料 来 
源 、 指 标的 注释 和 必要 的 说 明 等 内 容 。 






























































从 统计 表 的 内 容 上 看 ， 统 计 表 包括 主 词 和 宾 词 两 个 部 分 。 主 词 就 是 统计 表 要 说 明 的 总 
体 及 其 各 组 成 部 分 ， 宾 词 是 用 来 说 明 总 体 的 各 种 统计 指标 。 统 计 表 的 构成 如 表 2 - 11 
所 示 。 
表 2-11 2008 年 北京 奥运 奖牌 榜 (前 十 名 ) 一 表 头 
国 ”家 金牌 / 枚 银牌/ 枚 铜牌 / 枚 Fa 
中 国 51 21 28 
美国 36 38 36 
俄罗斯 23 21 28 
19 13 可 险 15 > 
种 国 16 10 4 15 
标 和 ze 料 
是 澳大利亚 14 5 17 
韩国 13 Aid 8 
日 本 9 “AN 10 
意大利 8 RS 10 10 
法 国 . A 16 这 
合 计 Sho 160 NA 184 
资料 来 源 ， 北 京 奥运 官 pI se 交 语 和 bsiineago oh 名 -附加 
上 一 划一 ~ 一 Ar 细 ~ 
,> 


2) 统计 表 的 设 让 一 不 
he een chi 

(1) 合理 安排 统计 表 的 结构 。 例 如 ， 行 标题 、 列 标题 、 数 字 资 料 的 位 置 应 安排 合 

(2) 表 头 一 般 应 包括 表 号 、 总 标题 和 表 中 数据 的 单位 等 内 容 。 

总 标题 应 简明 确切 地 概括 出 统计 表 的 内 容 ， 一 般 需 要 表明 统计 数据 的 时 间 、 地 点 及 何 
种 数据 ， 即 标题 内 容 应 满足 3W (统计 数据 的 时 间 、 地 点 、 何 种 数据 的 简称 ) 要 求 。 

(3) 如 果 表 中 的 全 部 数据 都 是 同一 计量 单位 ， 可 放 在 表 的 右上 角 标 明 。 若 各 指标 的 计 
量 单位 不 同 ， 则 应 放 在 每 个 指标 后 或 单列 出 一 列 标明 。 

(4) 表 中 的 上 、 下 两 条 线 一 般 用 粗 线 ， 中 间 的 其 他 线 要 用 细 线 ， 这 样 使 人 看 起 来 清 
楚 、 醒 目 。 

(5) 在 使 用 统计 表 时 ， 必 要 时 可 在 表 的 下 方 加 上 注释 ， 特 别 要 注 明 资料 来 源 ， 以 表示 
对 他 人 劳动 成 果 的 尊重 ， 方 便 读者 查阅 使 用 。 

3) 统计 表 的 分 类 

(1) 简单 分 组 下 的 统计 表 。 简 单 分 组 就 是 对 被 研究 现象 只 按 一 个 标志 进行 的 分 组 。 例 
如 ， 大 学 生 按 其 年 龄 、 性 别 、 所 学 专业 等 标志 进行 分 组 。 简 单 分 组 只 能 说 明 被 研究 现象 某 
一 方面 的 差别 情况 。 例 如 ， 表 2 - 12 是 按 一 个 品质 标志 (职位) 进行 分 组 的 简单 统计 表 
也 是 机 截面 数据 统计 表 。 
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表 2-12 2009 年 某 公司 中 层 干部 的 实际 收入 (单位 ; 万 元 ) 
i 实际 收入 
财务 部 经 理 10 
市 场 部 经 理 32 
人 事 部 经 理 ps 
研发 部 经 理 11 
生产 部 经 理 12 
合 计 73.5 





表 2-13 是 按 一 个 品质 指标 (时间) 进行 分 组 的 简单 匀 计 慌 入 所 是 时 间 序列 数 所 


计 表 。 CN 
De 
表 2-13 2010 一 2014 年 北京 市 城镇 人 口 数 统计 表 (单位 : 万 人 ) 








年 份 SSs- 城镇 人 口 数 


2010 








> |， 
2011 N AN 1740 
ES 


2012 WA 





2013 














资料 来 源 ， NO 8 和 国 国家 统计 局 httDy /YWww. stats. gov. cn/ 





(2) 复合 分 组 下 的 统计 表 。 复 合 分 组 就 是 采用 两 个 或 两 个 以 上 的 标志 结合 起 来 进行 分 
组 。 例 如 ， 大 学 生 可 先 按 性 别 进行 分 组 ， 在 此 基础 上 ， 再 按 所 学 专业 进行 分 组 。 采 用 复合 
分 组 可 以 对 被 研究 的 现象 做 更 深入 的 分 析 ， 但 也 不 宜 采 用 过 多 的 标志 进行 复合 分 组 ， 以 免 
组 数 过 多 ， 反 而 难以 显示 出 事物 的 本 质 特征 。 例 如 , 表 2- 14 是 一 个 先 按 地 区 ， 再 按 年 份 
进行 分 组 的 复合 统计 表 。 
































表 2-14 东北 三 省 2011 一 2014 年 GDP 对 比 表 (单位 : 亿 元 ) 
年 份 /年 
2011 2012 2013 2014 年 
地 区 
辽宁 22226. 70 24846. 43 27213. 22 28626. 58 
吉林 10568. 83 11939. 24 13046. 40 13803. 14 
黑龙 江 12582. 00 13691. 58 14454. 91 15039. 38 
合 计 45377. 53 50477. 25 54714. 53 57469. 10 

















资料 来 源 : 中 华人 民 共 和 国 国家 统计 局 http: //www. stats. gov. cn/. 
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表 2 -15 是 先 按 县 名 ， 再 分 别 按 家 庭 户 、 平 均 每 户 住房 间 数 和 人 均 住房 建筑 面积 进行 
分 组 的 复合 统计 表 。 








表 2-15 2000 年 天 津 市 辖 县 家 庭 户 住房 状况 

















县 名 家 庭 户 / 户 平均 每 户 住房 间 数 /个 人 均 住 房 建筑 面积 /m? 
宁 河 县 96343 2.83 al 
静海 县 165351 3.61 22.07 
宝 纸 县 178523 3. 56 20. 53 
区 县 213705 2. 51 19. 53 
合 计 653922 远 油 Ss 83. 34 








| A 
资料 来 源 : 《2000 人 口 普查 分 县 资料 》。 < : 


表 2 -16 是 一 个 重 每 排列 表 ， 即 先 按 县 名 ， 再 分 别 Sa 15 岁 及 以 上 文 





























盲人 口 和 文盲 率 ， 最 后 按 性 别 进行 分 组 的 复 全 关 H 
表 2-16 ee ees 
更 平均 受 教育 年 限 /年 RN、 fe 以 上 文盲 人 口 /人 文盲 率 /% 
县 
、 

男 a ESN 男 男 

宁 河 县 7.89 ho 6135 . 4. 55 13 
静海 县 7.89 X P00 < C27681 5. 06 13. 02 
宝 抵 县 Bo8 /| 6.97 500 Y | 34409 3.14 13. 87 

A > 

区 县 涉 N 7. 91 7.01 fty228 52738 5.75 17. 69 
合 计 | 人 51:8 27. 96 41745 133261 18. 50 58. 14 























资料 来 源 :《2000 年 人 口 普 查分 县 资料 )。 


2. 统计 图 

统计 图 就 是 利用 各 种 几何 图 形 表 现 统计 资料 的 形式 。 通 过 频数 分 布 表 ，” 国 关 员 回 
可 以 初步 看 出 数据 分 布 的 一 些 特征 和 规律 ， 但 如 果 用 图 形 来 表示 频数 分 布 的 总 
结果 ， 会 更 加 形象 和 直观 。 在 计算 机 运用 日 益 普 及 的 今天 ， 统 计 图 的 制作 可 回 
以 借助 于 计算 机 来 完成 。 常 用 的 显示 频数 分 布 特征 的 图 形 有 条 形 图 、 饼 图 、 【拓展 案例 】 
直方 图 和 线形 图 等 。 

1) 条 形 图 

条 形 图 (Bar Chart) 是 用 宽度 相同 的 条 形 的 高 度 或 长 短 来 表示 数据 频数 分 布 变 化 的 图 
形 ， 主 要 用 于 比较 同类 统计 指标 数值 ,分析 同类 指标 在 不 同时 间或 地 区 的 发 展 差异 ,一 般 
适用 于 顺序 和 分 类 变量 的 分 析 。 条 形 图 的 纵 坐 标 可 以 是 频数 ,也 可 以 是 频率 (百分比 )。 
例如 ,在 表 2-6 中 ,职工 受 教育 程度 的 频数 分 布 表 可 以 直观 地 用 条 形 图 来 显示 。 图 2.1 
是 以 频数 (Frequency) 为 纵 坐标 的 条 形 图 。 
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受 教育 程度 





oo 


频数 
~ 
T 





© 








小 学 


初中 高 中 
受 教育 程度 


图 2.1 “0 4 

2) 直方 图 
直方 图 (Histograms Chart) 网 a 绘制 直方 
图 时 ， 横 轴 表 示 各 组 组 限 ， aber, ， 然 后 按 分 布 在 各 组 的 频数 及 频率 确定 各 
组 在 纵 轴 上 的 坐标 ， et 直方 图 适用 于 定 距 














形变 量 的 分 析 。 此 外 ， 我 们 还 可 以 在 直方 图 上 附加 线 ， 以 便于 正 态 分 布 比较 。 
例如 ,在 表 2-6 中 ， 职 RR 地 用 直方 图 来 显示 。 图 2.2 是 以 
受 教育 程度 为 横 坐标 以 (Frequency) 为 ph 其 中 横 坐 标 中 的 1 代表 小 
学 ，2 代表 初中 ，3 中 ， 人 代 A 并 附加 了 正 态 分 布 曲线 。 


No 








2 3 
受 教育 程度 


2.2 职工 受 教育 程度 直方 图 
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直方 图 与 条 形 图 的 异同 


(1) 都 是 用 来 反映 数据 的 分 布 状况 ,适用 于 不 同类 型 的 数据 。 

(2) 条 形 图 是 用 条 形 的 高 度 表 示 各 类 别 频数 的 多 少 ， 其 宽度 (表示 类 别 ) 则 是 固定 的 。 

(3) 直方 图 是 用 面积 组 频数 的 多 少 ， 和 矩形 的 高 度 表 示 每 一 组 的 频数 或 百分比 ， 宽 度 则 表示 各 
组 的 组 距 ， 其 高 度 与 宽度 均 有 意义 。 

(4) 直方 图 的 各 和 矩形 通常 是 连续 排列 的 ， 条 形 图 则 是 分 开 排列 的 














maaan 





3) 饼 图 KN 
饼 图 (Pie Chart) 是 用 圆 形 及 圆 内 扇形 的 面积 来 表示 跨 数 分 布 变化 的 图 形 ， 利 于 研 
究 事物 内 在 结构 组 成 等 问题 。 饼 形 图 中 
、 辆 内 的 遍 形 面积 可 以 表示 频数 ， 也 可 以 
飞 表 示 频 率 (百分比 )。 但 是 ， 用 饼 图 表 
示 总 体 中 各 部 分 所 占 比例 就 比 条 形 图 要 
好 一 些 。 例如， 在 表 2 -6 中 ,职工 受 
教育 程度 的 频数 分 布 表 可 以 直观 地 用 人 饼 
图 来 以 示 图 2. 3 是 职工 受 教育 程度 的 
饼 图 二 
4) 线形 图 

线形 图 (Line Chart) 是 用 线条 的 上 
下 波动 来 反映 数据 变换 的 一 种 统计 图 形 ， 
主要 适用 于 描述 现象 在 时 间 上 的 变化 趋 
势 、 现 象 的 分 配 情况 和 现象 间 的 依存 关 
国生 3 天 开 要 数 育 各 诬 杂 图 系 。 图 2.4 是 2008 年 南方 区 域 及 五 省 

(区 ) 全 社会 用 电量 走势 。 


受 教育 程度 











700 


600 

500 = 一 合计 
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400 一 一 广西 
































加 
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机 300 一 一 云南 
x 一 一 贵州 
200 一 一 海南 
100 
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一 一 
1 月 2 月 2 月 4 月 5 月 6 月 7 月 8 月 9 月 10 月 1 月 12 月 


图 2.4 2008 年 南方 区 域 及 五 省 (区 ) 全 社会 用 电量 走势 
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您 阅读 案例 2 一 4 


统计 整理 为 经 营 者 提供 帮助 


企业 正 处 在 信息 化 时 代 ， 它 们 之 间 的 竞争 越 来 越 取决 于 信息 的 竞争 。 企业 统计 信息 工作 是 对 企业 实 
行 科学 管理 、 监 督 整个 企业 活动 的 重要 手段 ， 是 企业 制订 政策 和 计划 的 主要 依据 。 统 计 信息 参与 企业 次 
策 势 在 必 行 。 

一 手机 专营 店 的 经 营 者 为 完善 店内 的 销售 工作 而 组 织 了 一 项 统计 调查 ,力求 从 调查 中 找到 有 用 的 信 
息 ， 以 便 制订 更 好 的 销售 策略 来 满足 顾客 的 需求 。 

该 手机 专营 店 为 了 解 人 们 在 购买 手机 时 关注 的 因素 ， 随 机 调查 了 100 名 前 来 光顾 本 店 的 顾客 ， 当 问 
及 “您 在 选 购 手机 时 最 关注 的 问题 是 什么 ”时 ， 给 出 的 备 选 答案 是 : r 

A. 价格 B. 品牌 C. 售后 服务 D. 功能 EE. 外 观 1 

得 到 回答 的 原始 数据 记录 如 表 2 -17 所 示 。 SS 

料 


把 
表 2-17 100 名 回答 的 该 问题 的 原始 数 
C 
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根据 以 上 原始 数据 ， 你 能 概括 说 出 顾客 对 于 手机 的 反映 吗 ? 
为 了 观察 分 析 人 们 购买 手机 时 最 看 重 的 情况 ， 必 须 对 资料 的 数据 进行 分 类 整理 。 经 整理 得 到 的 频数 
分 布 表 如 表 2 -18 所 示 。 


表 2-18 顾客 购买 手机 关注 情况 频数 分 布 表 




















关注 类 型 数量 /人 频率 /% 
功能 13 43 
品牌 30 30 
价格 14 14 
外 观 8 8 

售后 服务 5 5 

合 计 100 100 
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由 此 可 见 ， 经 过 整理 后 
总 数 的 73%。 同 时 ， 
时 普遍 关注 的 是 功 





的 消费 者 最 多 ， 占 
， 即 现在 人 们 


赔 





也 可 以 得 出 相同 的 





与 


牌 。 
资料 来 源 : 曾 艳 英 . 应 用 统计 基础 [MJ. 北京 : 机 械 工业 





出 版 社 ，2010. 








日 功能 国 品 牌 口 价格 口外 观 图 售后 服务 











30% 


图 2.5 购买 手机 关注 因素 饼 图 


目 数量 





























功能 品牌 价格 外 观 售后 服务 
2.6 购买 手机 关注 因素 柱 形 图 


LA 实例 分 析 上 


在 校 大 学 生 旅游 情况 调查 


随 着 中 国 经 济 的 高 速 发 展 ， 人 民生 活水 平 不 断 提高 ， 越 来 越 多 的 人 出 外 旅游 ， 而 国家 
也 制定 了 多 个 假期 ， 以 满足 需要 。 旅 游 已 逐渐 成 为 人 们 娱乐 生活 中 不 可 缺少 的 一 部 分 。 人 
们 除了 能 享受 到 旅游 过 程 中 的 懂 意 与 放松 其 实 更 多 的 是 对 生活 的 体味 。 对 于 大 学 生来 
说 ,除了 国家 法 定 节假日 外 ,还 有 寒暑 假 ， 比 较 起 来 有 更 多 的 出 游 时 间 ， 而且 当代 大 学 生 
的 求知 欲 非 常 强 ， 消费 水 平 也 在 不 断 提高 。 因 此 ， 越 来 越 多 的 大 学 生 喜 欢 出 外 旅游 。 
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那么 ， 大 学 生 的 旅游 现状 完 竟 如 何 ? 他 们 又 有 哪些 需求 ? 2016 年 初 ， 某 高 校 学 生 在 
老师 的 指导 下 组 成 调研 小 组 ， 对 该 校本 科 生 的 旅游 状况 进行 了 统计 调查 。 通 过 对 他 们 旅游 
的 目的 、 方 式 、 花 费 、 地 点 等 方面 的 调查 ,客观 、 真 实地 了 解 本 科 生 旅游 的 实际 情况 ， 并 
且 利用 调查 的 数据 进一步 分 析 和 探讨 了 大 学 生出 游 的 观念 和 需求 ， 为 旅游 机 构 进一步 开发 
旅游 市 场 提供 可 参考 的 依据 。 本 次 调查 需要 研究 的 问题 是 : 

(1) 指出 本 次 调查 的 目的 。 

(2) 确定 使 用 的 调查 方法 。 

(3) 设计 出 一 份 调查 问卷 。 

(4) 收集 调查 数据 ， 并 进行 整理 ， 写 出 调查 分 析 报告 。 

一 、 学 习 目 标 

通过 本 案例 的 学 习 ， 要 求学 生 掌 握 统计 调查 的 基本 流程 和 方法 ， 能 够 对 调查 结果 进行 
有 效 的 分 析 。 人 

二 、 案 例 分 析 

(1) 调查 目的 : 了 解 当今 大 学 生 旅游 的 现状 和 项 泪 ， 为 入 学 生 的 旅游 市 场 开发 提供 可 
行 的 建议 。 SS 

(2) 调查 方法 : 本 案例 的 抽样 调查 的 总 体 是 业 粮 本 科 毕 业 生 。 采 用 的 抽样 方法 是 两 阶 
段 抽样 : 第 一 阶段 为 分 层 抽样 ， 以 宿舍 为 禄 其间 入， 按 专业 和 性 别 分 层 ; 第 二 阶段 为 随机 
抽样 ， 在 第 一 阶段 抽 到 的 宿 合 内 随机 萎 驱 学 生 作为 调查 对 象 。 kat 
103 份 ， 调 查 对 象 为 大 学 一 年 级 至 大 和 ee da 

(3) 调查 问卷 : > J 








es 
您 好 ! 们 定妆 天 学 学 生 现在 我 机 要 对 旅游 情况 进行 一 项 调查 ， 非 常 期 望 您 能 
够 抽出 几 分 的 时 间 参 与 我 们 的 调查 / 请 您 认真 回答 下 列 问题 ， 问 题 没有 正确 与 错 
误 之 分 ， 关 键 是 能 真实 表达 您 的 看 法 ， 非 常 感谢 您 的 合作 ! 

请 填写 您 的 基本 信息 : 

姓名 性 别 专业 年 级 

以 下 各 题 请 您 在 您 要 选择 的 选项 “ 口 ”上 划 “\/”。 
. 在 大 学 期 间 您 是 否 出 外 旅游 过 : 口 是 “ 口 知 
最 喜欢 德 旅游 目的 地 : 口 自然 景点 器 人 文 景点 口 休闲 度假 村 
您 一 年 出 游 几 次 : 口 1 一 2 次 3 一 5 火 : 5 次 以 上 
您 旅游 的 主要 目的 〈 多 选 ) : 
欣赏 自然 风景 口 购物 口 寻求 刺激 口 增长 见识 。 口 探险 ” 口 摆脱 束 缔 
摆脱 学 习 压 力 ” 口 结识 新 朋友 ” 口 其 他 
. 影响 您 旅 游 地 点 选择 的 主要 因素 (多 选 ): 
时 间 (休假 时 间 的 长 短 、 季 节 ) ” 口 旅游 费用 ” 口 时 间 口 目的 地 资源 吸引 力 
交通 便捷 程度 口 其 他 
. 您 旅游 一 般 所 需 费 用 : 少 于 200 201 一 500 501 一 800 801 一 1000 
多 于 1000 












































9 

















旬 











w 





















































a 

































































[en 























054 

















应 用 统计 学 (第 3 版 ) »》 





骑 自 行车 旅游 








7. 您 最 喜欢 的 旅游 方式 (多 选 )， 口 自助 旅行 口 随 团 旅游 
徒步 背包 旅游 “ 口 野 营口 探险 旅行 口 其 他 
.您 的 旅游 信息 主要 来 源 于 (多 选 ): 
直接 获取 (从 旅行 社 ) 口 报纸 杂志 口 电视 广播 口 朋友 介绍 口 网 上 浏览 
其 他 

9. 您 是 否 愿意 从 旅行 社 获得 相关 咨询 。 口 是 “ 口 否 

10. 您 旅行 中 主要 选用 的 住宿 方式 ， 口 住 在 亲 威 /朋友 家 口 宾馆 口中 小 型 旅馆 
野外 露营 

,您 是 否 考 虑 随 旅行 社 出 游 ， 口 是 口 否 
12. 您 旅行 中 主要 选用 的 交通 工具 (多 选 ): 口 飞机 口 轮船 口 火车 “ 口 巴 士 
自驾 车 “ 口 脚 路 车“ 口 徒步 口 其 他 从 
3. 您 旅游 途中 您 最 关心 的 事情 (多 选 ): 

住宿 口 导 游 口 饮食 口交 通 口 天 气 Rn 
14. 对 于 您 在 历次 旅游 过 程 中 ， 最 不 满意 的 是 ; 江 - 
旅行 社 导 洲 未 尽职 责 口 旅行 社 库 信 等 组 入 
旅行 社 配套 设施 不 完善 其 他 > 

5. 您 认为 在 景区 内 的 餐厅 就 区 (多 渤 注 

不 方便 口 价格 偏 高 这 服务 差 

6. 您 旅游 最 音 欢 去 的 地 方 是 % 

理由 : KK vA 7 
7 Ne 人 

理由 : ¥- 

调查 员 这 审核 员 _ 人 一 调查 时 间 


六 > 


(4) 调查 分 析 报 告 

四 关于 旅游 目的 、 次 数 和 信息 来 源 的 选择 。 

ele NLS te pan en ak 
出 ， 出 于 摆脱 学 习 压 力 、 欣 赏 自然 风光 和 增长 见识 的 大 学 生 占 多 数 。 如 图 2.7 所 示 。 
外 ， 大 学 生 一 年 出 去 旅游 的 次 数 在 1 一 2 次 的 占 85 冯 ,3 一 5 次 的 占 13%, 而 5 次 以 上 的 仅 
占 2%。 
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_ 至 于 旅游 信息 的 来 源 ， 主 要 还 是 
结识 新 朋友 他 沉 昌 然则 景 。 。 以 朋友 之 间 的 互相 介绍 为 主 ， 原 因 是 
7% eK 
一 般 朋 友 介 绍 的 ， 总 会 认为 是 可 以 值 
寻求 刺激 ”得 相信 的 旅游 好 地 点 。 另 外 ， 大 学 生 
rr 之 间 的 互动 性 和 相仿 性 也 是 很 高 的 。 
18% 也 有 一 些 大 学 生 愿 意 从 旅行 社 获得 相 
关 信 息 ， 因 为 毕竟 是 专业 机 构 ， 信 息 
图 2.7 大 学 生 旅游 目的 频率 分 布 图 的 参考 性 较 强 。 






摆脱 学 习 压 力 
21% 





摆脱 束缚 探险 
15% 2% 
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回 关于 旅游 地 点 、 方 式 和 费用 的 选择 。 
调查 资料 显示 ,68% 的 人 表示 喜欢 休闲 度假 村 和 自然 景点 ， 由 于 大 学 生 就 业 、 学 习 压 
力 大 ， 去 一 些 自然 中 的 景点 是 大 部 分 人 的 首选 地 ， 那 种 超越 自然 的 感觉 ， 可 以 使 他 们 暂时 
缓解 学 习 压 力 ， 精 神 得 到 放松 舒缓 。 影 响 大 学 生 旅游 地 点 的 主要 因素 是 时 间 和 费用 ， 因 
此 ,本 市 及 周边 地 区 则 是 学 生 们 的 首选 。 此 外 ,调查 结果 也 表明 ,大 部 分 大 学 生 比 较 钟 情 
于 欧洲 。 因 为 那里 的 历史 文化 、 建 筑 风格 和 神秘 气息 深 深 地 吸引 了 他 们 。 
毋庸 置疑 ， 大 学 生 目前 的 旅游 方式 还 是 以 自助 旅游 为 主 ， 占 到 66% (图 2.8)， 一 般 
都 是 约 三 五 个 好 友 一 起 出 游 。 








目 自助 旅行 图 随 团 旅游 口 骑 自 行车 旅游 口 徒步 背包 旅游 
国 野营 目 探 险 旅行 图 其 他 











rm 


大 学 生 的 旅游 和 用 为 500 元 永 汪 的 占 了 大 部 分 (图 筷 由 于 绝 大 多 数 的 大 学 生还 没 
有 收入 ， 生 活 费 主要 来 源 于 交 天 ; 四 此 大 多 站 人 的 站 人 是 此 于 性 的 ， 


四 关于 区 坟 交通 工交 作答 和 就 关 的 
2 1000 口 多 于 1000 国 器 目 








选择 





3% 


于 于 攻 流 A i 
汽车 的 学 生活 六 2%， 只 有 2% 的 学 生 选 
择 了 飞机 。 关于 往 闪 的 问题 ， 80% 的 人 选 
择 中 小 型 旅馆 ， 只 有 3% 左右 的 人 选择 实 
馆 。 从 这 次 的 分 析 数 据 来 看 ， 学 生 们 普遍 
反映 景区 内 就 餐 价格 高 ; 此 外 ， 有 些 景点 
的 卫生 条 件 和 服务 质量 较 差 也 是 大 学 生 比 
较 关心 的 话题 (图 2.10)。 因 此 ， 如 果 一 
个 旅游 景点 想 要 吸引 游客 ， 除 了 价格 因素 
外 ， 还 需要 在 服务 水 平等 各 方面 下 功夫 。 

@ 关于 旅游 影响 因素 的 选择 。 

在 众多 影响 大 学 生 旅游 的 因素 中 ， 住 宿 、 交 通 、 天 气 、 卫 生 、 安 全 这 5 个 方面 被 大 学 
生 认 为 对 外 出 旅游 是 比较 重要 的 。 在 本 次 调查 中 ， 大 学生 最 为 关注 的 就 是 天 气 因素 ， 占 了 
本 次 统计 调查 的 33. 3%。 学 生 们 大 都 喜欢 在 春 、 秋 两 季 天 气 凉 正 的 时 候 出 去 旅游 ， 因 为 磁 
上 高 温 或 朋 丙 天 。 影响 旅游 的 好 心情 。 另 外 ,交通 问题 占 了 本 次 统计 调查 的 34. 7%。 去 旅 
游 ， 学 生 们 都 希望 不 要 在 车 上 或 任何 其 他 交通 工具 上 耽搁 太 久 时 间 ， 因 为 旅游 时 间 原 本 就 





图 2.9 大 学 生 旅 游 费用 频率 分 布 图 
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价格 偏 高 服务 差 卫生 条 件 差 ge 
图 2.10 0 


很 此 疾 ， 这样 浪费 时 间 会 让 他 们 觉得 玩 得 不 尽 关 。 EA I 
计 调 查 的 23%， 学 es 全 有 保障 ,旅游 起 来 才 会 开心 。 

综 上 所 述 ， 随 着 人 民 的 生活 水 平 不 断 提 消费 变 得 越 来 越 热 ， 出 外 旅游 已 成 为 
人 们 生活 中 必 不 可 少 的 部 分 。 在 旅游 群 人 天 学 生 是 整个 旅游 市 场 的 一 个 重要 而 又 独 
立 的 组 成 部 分 。 大 学 生 作为 社会 的 一 人 ee 具有 一 定 的 经 济 独立 能 力 和 自我 生活 能 
力 ， ep 这 些 促成 了 大 学 生 旅游 热 。 因 
此 ， 大 学 生 作 为 一 ee . 雪 符 罕 国 高 校 数量 已 达 2000 多 所 ， 
A 8 是 一 个 巨大 的 市 场 ， 值 得 旅游 机 构 
关注 


~ 
NY 本 各 小 结 
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统计 主要 研究 现实 生活 中 的 数据 ， 它 通过 收集 、 整 理 、 描 述 和 分 析 数 据 来 帮助 人 
们 对 事物 的 发 展 做 出 合理 的 判断 ， 能 够 利用 数据 信息 和 对 数据 进行 处 理 已 成 为 信息 时 
代 每 一 位 公民 必 备 的 素质 。 通 过 对 本 章 的 学 习 ， 要 求学 生 能 够 灵活 运用 各 种 数据 收集 
方法 收集 数据 ， 掌 握 统计 分 组 的 方法 和 技巧 ， 理 解 组 距 数 列 中 有 关 概 念 ， 掌握 频数 分 
布 表 的 编制 方法 。 








关键 术语 
frequency 频数 percentage 频率 
cumulative frequencies ”累计 频数 cumulative percentage 累计 频率 
bar chart 条 形 图 histograms chart 直方 图 


pie chart 饼 形 图 line chart 线形 图 
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习 题 2 
一 、 选 择 题 
1. 对 家 用 电器 的 平均 寿命 进行 调查 ,应 该 采用 ( 。 )。 
A. 普查 B. 重点 调查 C. 典型 调查 D. 抽样 调查 


2. 2009 年 6 月 新 浪 网 进行 的 一 项 网 络 调查 中 ， 把 调查 问卷 刊登 在 网 站 上 ， 然 后 由 感 
兴趣 的 网 民 自 行 填写 。 在 回答 问题 的 人 员 中 有 47. 5 中 的 人 认为 高 游 会 改变 个 人 一 生 的 合 
Ra 的 人 认为 高 考 会 改变 个 人 
一 生 的 命运 "。 这 一 结论 ( ) 。 了 RY 
A. 完全 正确 B. 不 准确 因为 没有 给 出 置信 区 间 
C. 不 准确 ， 因 为 样本 缺乏 对 目标 总 体 eo D. 不 能 确定 
在 扩 样 中 以 下 会 和 机 $s 
. 数据 录入 错误 、A\GB' 被 调查 者 拒 答 
. 调查 员 编造 数据 ， MX》 D. 以 上 者 对 3 、 

在 问卷 设计 中 ， 以 下 间 题 设计 的 最 为 合理 的 是 (7 六 ， 
国家 认为 HINT 病 毒 是 可 防 可 治 的 ， 你 认为 呢 六 
. 你 喜欢 足球 和 篮球 运动 吗 ? NY 


你 经 常 .上网 机 人 从 
i we | 


某 组 向 上 累计 频数 表示 ( 。。 )。 
. 大 于 该 组 上 限 的 频数 有 多 少 。 ”B. 大 于 该 组 下 限 的 频数 有 多 少 
.小 于 该 组 上 限 的 频数 有 多 少 。 ”D. 小 于 该 组 下 限 的 频数 有 多 少 
6. 某 连 续 式 组 距 分 组 数列 ， 其 末 组 为 开口 组 ,下 限 为 500， 又 知 其 相 邻 组 的 组 中 值 为 
480， 则 末 组 的 组 中 值 为 ) 。 











人 











520 B. 510 C. 500 D. 490 
统计 分 组 时 ， 若 某 标志 值 刚好 等 于 相 邻 两 组 上 、 下 限 数值 时 ( $s 
将 此 数值 归 入 上 限 所 在 组 B. 将 此 数值 归 入 下 限 所 在 组 


归 入 这 两 组 中 任意 一 组 均 可 D. 另 立 一 组 

人 口 普查 是 ( Ns 

专门 调查 。”B. 非 全 面 调查 。 C. 经 常 性 调查 
一 次 性 调查 ”E. 全 面 调查 

非 全 面 调查 方式 包括 ( Ds 

普查 B. 抽样 调查 C. 全 面 统计 报表 D. 
典型 调查 








MpPIPmApPN Pp 
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10. 统计 表 从 内 容 上 看 ， 由 ( ) 构 成 。 

A. 总 标题 B. 主 词 C. 横行 标题 D. 纵 栏 标题 
下 宾 词 

二 、 简 答题 

1. 区 别 下 列 概念 。 

(1) 普查 与 统计 报表 。 

(2) 重点 调查 与 典型 调查 。 

(3) 登记 性 误差 与 代表 性 误差 。 

(4) 品质 标志 与 数量 标志 。 

(5) 单项 式 分 组 与 组 距 式 分 组 。 

(6) 频数 与 频率 。 伦 
(7) 向 上 累计 与 向 下 累计 。 

2. 统计 调查 有 哪 几 种 主要 组 织 形式 ? 请 分 别 比 较 它 wh 作用 和 适用 场合 。 
ee 样 选取 的 ?举例 说 明 。 

4. 问卷 的 基本 结构 是 怎样 的 ? 
5 
6 
% 





.怎样 确定 等 距 分 组 中 的 组 距 、 组 数 Wai 


. 统计 表 从 结构 上 看 ， 一 般 要 由 骨 es 组 成 ? 
. 条 形 图 、 饼 图 、 直 方 图 和 形 阐 窜 什么 情况 下 使 用 ? 
= 
1. 您 和 您 家 里 人 对 现 有 三 房 条 件 是 否 满意 ? x 
2. 绝 大 多 数 人 对 食 妆 人 服务 都 委 清 意 ， J 
3. 您 对 本 餐厅 是 否 满意 

4 


. 您 是 否 有 A * 泡 
.您 最 近 塞 过 电影 吗 ? 
四 、 计 算是 


1. 为 了 解 4 种 品牌 的 锐 装 啤酒 的 市 场 占有 率 ， 在 某 超 市 随机 记录 了 50 名 顾客 购买 啤 
酒 的 品牌 记录 的 原始 数据 如 下 : 


A B C C D B A 于 E C 
€ B A D D A A C B 
C C 也 A B A D A A C 
D C D A A 入 C B A C 
A C B D D A A C B C 


试 根据 上 面 的 资料 编制 频数 和 频率 分 布 表 。 

2. 某 班 40 名 学 生 统计 学 考试 成 绩 分 别 如 下 : 
66 89 88 84 86 87 75 73 72 68 
75 82 97 58 81 54 79 76 95 76 
71 60 90 65 76 72 76 85 89 92 
64 57 83 81 78 77 72 61 70 81 

















学 校规 定 : 
，90 一 100 分 为 优 。 


(1) 将 该 班 学 生 分 为 不 及 格 、 及 格 、 中 、 良 、 优 5 组， 编制 一 
分 组 方法 的 类 型 ， 


(2) 指出 分 组 标志 


2200， 
2700， 
2100， 
2490， 

假定 组 数 为 6， 


及 类 型 、 
3. 某 单位 40 名 职工 的 月 工资 (元 ) 
3110，2930， 
3200，3100， 
1130，1940， 


2600，2310， 


60 分 以 下 为 不 及 格 ， 


60 一 70 分 为 及 格 ， 


2890， 
2390， 
2510， 
1890， 


2500， 


2380， 


2800， 


2370， 


2300 
2470， 
2200， 
2610， 
组 距 为 500， 试 运用 数值 型 数据 整理 的 方法 
等 距 分 组 ， 并 计算 频数 分 布 、 编 制 统计 表 和 统计 图 。 


4. 某 企 业 生 产 某 种 零件 需 经 6 道 工序 ， 为 提高 质量 
。 结 果 如 表 2 -19 所 示 。 
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70 一 80 分 为 中 ， 


一 张 分 数 


80 一 90 分 为 


分 配 表 。 


分 析 本 班 学 生 的 考试 情况 。 


情况 如 下 : 


2710， 
3800， 
2550， 
2830， 


了 Se 


2450， 
2740， 
2570， 
1620， 
采用 重 


2450， 
3590， 
2240， 
2430， 


2450 
2410 
2540 
2430 
合 组 限 设 兽 进行 


ssz 季度 全 部 废品 产生 的 原 
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表 2- 19 某 企业 第 三 季 CD cms 
工序 名 称 废品 数 /个 


x 


2600 




















As 二 SS 2 全 1000 

As -A Ny 以 300 

> 3 -XT 52 

> Ws | 交 - A 25 
不 和 

/ JA, A 23 
入 合计 4000 








试 绘制 累计 频数 分 布 表 ， 并 进行 分 析 。 
5. 根据 表 2- 20 中 数据 之 间 的 关系 填空 ， 并 绘制 直方 图 。 
表 2-20 变量 值 、 频 数 、 频 率 及 累计 频率 的 关系 























变量 值 频 数 频率 /% 累计 频率 /% 
10 以 下 
10 一 30 85 44. 1 
30 一 50 21.8 
50 一 100 41 17.9 
100~200 94. 32 
200 以 上 
合计 229 100 
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6. 填写 表 2 - 21 中 的 空格 ， 并 绘制 频数 分 布 条 形 图 。 
表 2-21 
按 定额 完成 向 上 累计 向 下 累计 
a | 2 频率 /% 频率 /1% 
80 一 90 6 
90 一 100 18 
100 一 120 24 
120 一 150 12 
合计 A 
ES 
ET ,X- 
SS- 
1. 实 训 项 目 nn 
实 训 目的 ， 掌握 统计 数据 收集 、 SS 理解 并 会 正确 使 用 。 
实 训 内 容 ， 学 校 后 勤 集团 饮 于 心 入 通过 调查 了 解 以 下 问题 ， 
(1) 学 生 的 饮食 偏好 。 BR % 
(2) 学 生 对 餐饮 消费 习惯 6 xz 多 


(3) 学 生 对 学 校 库 的 评价 及 清 塌 委 度 

假设 你 是 饮食 服务 中 心 的 负责 人 ， wy 请 你 : 

(1) 设计 出 广 食油 查 方案 。 下 从 

02) 确定 视 攻 前 调 查 方法 、 | 

(3) 设计 出 一 份 调查 问卷 。 

(4) 收集 调查 数据 ， 并 进行 整理 ， 写 出 调查 分 析 报告 。 

2. 实 训 项 目 ， 学 生 月 消费 支出 情况 调查 

实 训 目的 ， 掌握 统计 数据 收集 、 整 理 和 显示 的 方式 ， 理 解 并 会 正确 使 用 。 

实 训 内 容 ， 随 意 抽取 某 专业 两 个 班 的 学 生 ， 对 连续 2 个 月 的 月 生活 费 支出 情况 进行 调 
查 ， 以 此 反映 当代 大 学 生 的 消费 热点 .研究 学 生 学 习 生活 需求 。 要 求 ， 

(1) 设计 一 个 完整 的 调查 方案 

提示 : 调查 项 目 应 包括 被 调查 学 生 的 月 生活 费 支 出 、 生 存 所 需 的 基本 月 生活 费 、 学 习 
费 (学 费 、 学 习 用 有 具 费 、 资 料 费 等 )、 课 外 培训 费 、 零 食 消费 、 娱 乐 消费 (上 网 、 看 电影 、 
郊游 等 )、 其 他 消费 。 

(2) 设计 出 调查 问卷 。 

(3) 利用 课余 时 间 实施 调查 。 

(4) 搜集 并 整理 原始 数据 资料 ， 编 制 统计 表 ， 绘制 合适 的 统计 图 。 

(5) 将 调查 资料 整理 装订 好 ， 留 待 以 后 整理 分 析 时 使 用 。 
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[和 < 宁 例 思考 与 讨论 


2008 北京 奥运 会 奖牌 数 的 分 布 及 构成 分 析 


2008 年 8 月 8 日 至 2008 年 8 月 24 日 在 北京 举办 的 第 29 届 奥 运 会 取得 了 巨大 成 功 。 
国际 奥 委 会 主席 罗 格 的 评价 是 “一 届 真 正 的 无 与 伦比 的 奥运 会 ”>。 在 本 届 奥 运 会 上 ， 中 国 
体育 代表 团 取 得 的 金牌 第 一 、 奖 牌 总 数 100 枚 的 历史 最 好 成 绩 。 在 本 届 奥 运 会 上 ， 共 设 有 
奖牌 958 枚 ， 其 中 金牌 302 枚 ， 银 牌 303 枚 ， 铜 牌 353 枚 。 表 2- 22 是 取得 金牌 总 数 前 三 
名 的 国家 所 获得 的 奖牌 分 布 情况 。 


表 2-22 取得 金牌 总 数 前 三 名 的 国家 所 获得 的 奖牌 分 布 情况 

















排 男子 女子 A 总 计 

名 | 家 | 金 | 银 | 铀 | 总 | 人 金 | 银 | 铀 | 总 | 金 饼 :| 多 总 | 金 | 银 | 铜 | 总 

1 中 国 24 10 8 42 27 11 19 57 > 二 1 1 3 21 28 |100 

2 美国 20 13 20 53 15 23 15 As N\ 1Y 2 1 4 36 38 36 |110 
俄罗斯 
























































\ 
需要 分 析 的 问题 ; NS- 
(1) 要 描述 中 国 男 、 Re 你 愉 汶 应 该 使 用 哪 种 图形 ? 请 画册 


这 一 图 形 。 

作业 请 画 出 这 
一 图 形 。 
(3) 要 此 相让 国生 国信 所 人 和 NA 你 认为 应 该 使 用 哪 种 图 形 ? 请 


画 出 这 一 NS 





回 
【参考 答案 】 
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| & 0 从 

通过 本 章 的 学 习 ， 要 求 了 解数 据 特征 测度 的 意义 ; We 征 描述 方法 ; 了 解 集中 趋 
势 和 离散 程度 的 含义 ; 人 生计 四 方法 、 不 同方 法 的 特点 和 
应 用 场合 。 





| x sR < 
EN 
< 人 
知识 要 点 力 要 相关 知识 
集中 趋势 描述 党 提 儿 世代 家 入 委 的 档 述 方法 。 、， 汪汪 艾 坎 、 众 教 、 中 位 孝 、 分 位 





9 .ap | 


Y > > a 

极 差 、 四 分 位 差 、 方差 、 标 准 差 、 

离散 程度 描述 的 i Cd 
Si 。 


变异 系数 、 异 众 比率 
因 ss 











分 布 形 态 档 这、》 掌握 数据 分 布 形态 的 檀 违 方法 峰 度 、 偏 度 





统计 数据 经 过 整理 与 显示 后 ， 我 们 对 数据 分 布 的 类 型 和 特点 就 有 了 一 个 大 致 的 了 解 ， 但 这 
种 了 解 只 是 表面 上 的 。 要 进一步 掌握 数据 分 布 的 特征 和 规律 ， 还 需要 找到 反映 数据 分 布 特征 的 
各 个 代表 值 。 统 计 中 对 数据 的 特征 描述 主要 从 3 个 方面 入 手 ， 即 集中 趋势 的 描述 、 离 散 程度 的 
描述 及 分 布 形态 的 描述 。 
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鳗鱼 的 公共 繁殖 场所 

费 希 尔 在 1952 年 的 一 篇 文章 中 举 了 一 个 例子 ,说明 如 何 由 基本 的 描述 统计 量 的 知识 引出 一 个 重要 的 
发 现 。 

20 世纪 早期 ， 哥 本 哈 根 卡尔 堡 实验 室 的 施 密 特 发 现 不 同 地 区 所 捕获 的 同 种 鱼 类 的 稍 椎 骨 和 妥 腺 的 数 
量 有 很 大 不 同 ， 是 指 在 同一 海湾 内 不 同 地 点 所 捕获 的 同 种 鱼 类 也 发 现 同 样 的 倾向 ,然而 ,鳗鱼 的 消 椎 骨 
的 数量 变化 却 不 大 。 施 密 特 从 欧洲 各 地 、 冰 岛 、 亚 速 尔 群岛 和 尼罗河 等 几乎 分 离 的 海域 里 所 捕获 的 鳗鱼 
的 样本 中 ， 计 算 发 现 了 几乎 一 样 的 均值 和 标准 偏差 值 。 

施 密 特 由 此 推断 : 所 有 各 个 不 同 海域 肉 的 鳗鱼 是 由 海洋 中 某 公共 场所 转交 的 。 后 来 名 为 “ 戴 纳 ”的 
科学 考察 船 在 以 此 远征 中 发 现 了 这 个 场所 。 《TS 

和 


对 于 此 案例 ， 施 密 特 是 如 何 做 出 推断 的 ? 全 本 中 所 计算 和 的 均值 和 标准 人 
值 对 推断 有 何 作用 么 ?通过 本 章 有 关 样本 数据 的 特定 数 的 学 习 就 可 以 明白 其 中 的 道理 。 


A 
3 1 集中 丰 势 的 措 


集中 趋势 (Central Tenideriey) 是 指 一 组 数据 向 菜 二 中 心 值 靠近 或 集中 的 程度 ， 测 度 
he ila 在 实际 应 用 中 ， 集 中 趋势 的 测度 值 
主要 是 为 了 表示 社会 多 济 搞 象 总 体 各 单位 基 一 标志 在 一 定时 间 、 地 点 和 条 件 下 达到 的 一 般 
水 平 ， 经 常 被 作为 证 价 事物 和 决策 的 数 蕉 核准 或 参考 。 集 中 趋势 的 测度 值 主要 有 ， 平均 
数 、 众 数 、 中 往 数 油分 位 数 。 记 回 亲 党 回 


3.1.1 平均 数 百 
k 


平均 数 就 是 全 部 数据 的 算术 平均 ， 可 以 概括 地 反映 全 部 数据 的 平均 水 平 。 【拓展 知识 了 
平均 数 一 般 用 三 来 表示 。 平均 数 是 数据 集中 趋势 的 最 主要 测度 值 ， 它 主要 适用 于 数值 型 数 
据 ， 但 不 适用 于 分 类 数据 和 顺序 数据 。 根 据 所 掌握 数据 资料 的 形式 〈 即 数据 资料 是 否 经 过 
整理 )， 我 们 可 以 将 平均 数 分 为 简单 平均 数 和 加 权 平均 数 两 种 计算 形式 。 


您 阅读 案例 3- 1 


















































平均 数 掩盖 贫困 户 回国 
张 家 有 钱 一 千 万 
九 个 邻居 穷 光 蛋 [De 
平均 起 来 算 一 算 【拓展 案例 】 
个 个 都 是 张 百 万 


1994 年 1 月 6 日 ， 山 西 日 报 的 两 位 记者 撰文 《平均 数 掩盖 贫困 户 》。 文章 反映 ， 在 一 个 户 人 均 收 入 
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声称 达 千 元 的 村 里 ，71% 的 户 人 均 纯 收入 不 到 500 元 ,不 到 350 元 温饱 线 的 占 32% 。 平 均 数 之 所 以 达到 
千 元 ， 是 因为 村 里 有 6 户 个 体 建筑 大 户 的 人 均 收入 在 3 万 元 以 上 。 

1994 年 3 月 4 日 ,中国 信息 报 记者 撰文 :“ 根 据 调 查 测 算 ，1993 年 我 国 农民 人 均 纯 收入 的 平均 线 已 
向 千 元 大 关 冲 刺 ， 达 921.4 元 ， 比 上 年 增长 137.4 元 ,增长 17. 5 中 ,值得 注意 的 是 ， 收 入 水 平 达 此 线 的 
只 有 11 个 省 份 ， 占 38 冯 ， 这 一 百分数 比 去 年 下 降 了 3 个 百分点 ， 这 表明 ,农民 人 均 收 入 的 平均 线 并 不 代 
表 大 多 数 农民 的 收入 水 平 。” 

《中 国 经 济 时 报 》2002 年 3 月 1 日 的 《 质 蜂 “人 均 ”统计 数字 》 一 文中 报道 说 ， 中 国 房地产 协会 会 长 
杨 慎 谈 到 ，15 年 来 ， 我 国 一 直 用 “人 均 居 住 面积 ”来 反映 居民 的 住房 水 平 ， 这 一 指标 是 不 很 科学 的 。 当 
官 的 、 有 钱 的 永远 住 的 都 是 大 房子 ， 有 的 别墅 售 楼 广告 牌 标明 200 一 400m2? ， 把 那些 官 人 和 富 人 阶层 的 住 
房 面积 平均 到 普通 老百姓 的 头 上 ， 这 能 算得 上 居民 住房 水 平 提高 吗 ? 

平均 值 是 一 种 常用 的 统计 指标 ， 用 来 反映 现象 的 集中 趋势 ， 然 而 在 某 些 时 候 ， 平 均值 的 描述 作用 会 
“失效 "。 统 计 学 中 描述 现象 集中 趋势 的 指标 很 多 ， 在 分 析 过 程 中 ， 我 们 应 该 根据 数据 的 特征 来 选择 恰当 


的 统计 指标 ， 以 求 达到 准确 描述 数据 的 目的 。 入 
1. 算术 平均 数 (Mean) Ee 狼 
SN 
1) 简单 算术 平均 数 站 


简单 算术 平均 数 就 是 全 部 数据 的 算术 平均 数 ,/ 适 上 经 分 组 整理 的 原始 数据 资料 。 
它 是 直接 将 各 个 数据 相 加 ， 再 除 以 数据 个 数 。 A 为 
页 


(3=1) 


式 中 ， zz，*…，Zn 是 一 村 Nm, n 为 样本 容量 。 
【 例 3. 国 人 均 数 算 例 ) 某 下 级 20 名 学 生 的 期 林 数 学 成 绩 
(单位 : 分 ) 是 67，78，49 58 98，87，62，100; 2 5, 70, 44, 96, 80, 49, 61、 
60, 88, 93, 60, ge 
八 
解 : 由 公式 (3=1)， we 


A 区 ~ 人 和 
让 X (67 十 78 十 49 十 56 十 98 十 87 十 62 十 100 十 73 十 45+4 
70 十 44 十 96 十 80 十 49 十 61 十 60 十 88 十 93 十 60) 
二 70. 8( 分 ) 
即 该 班 学 生 的 数学 平均 成 绩 是 70. 8 分 。 
2) 加 权 算术 平均 数 
加 权 算术 平均 数 适用 于 已 经 分 组 整理 并 编制 出 频数 分 布 的 数据 资料 。 它 是 通过 各 组 标 
志 值 与 各 组 频数 相 乘 的 总 和 除 以 各 组 频数 之 和 得 到 的 。 其 计算 公式 为 











F= l= Fl (3-2) 





i=i Fl 
式 中 ，x; 是 单项 式 分 组 形式 下 第 i 组 的 变量 值 或 组 距 式 分 组 形式 下 第 i 组 的 组 中 值 ，/; 是 


第 i 组 的 频数 ; -一 是 第 i 组 的 频率 ; 为 组 数 。 
DB 
i=1 
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【 例 3. 2】 (已 经 整理 的 单项 式 分 组 数值 型 数据 平均 数 算 例 ) ”根据 第 2 章 中 的 表 2-6 
中 的 数据 资料 计算 某 单 位 职工 的 平均 家 庭 人 口 数 。 
解 : 显然 , 表 2-6 是 一 个 单项 式 频数 分 布 表 。 列 表 3 -1 如 下 : 
表 3-1 职工 家 庭 平均 人 口 数 的 辅助 计算 表 











fi fi 
家 庭 人 口 数 频率 全 Ey 
多 A 当 史 p37 





家 0. 027 0. 027 
38 0. 149 0. 298 








105 0. 412 1. 236 


1 

2 

3 

4 54 0.212 fs 0. 848 
5 31 0. 122 7 0. 610 
6 20 三 0. 468 


由 公式 (3 -2)， 得 < 























i=1 NA 1 XX、 
=0. 0271 07298 + 1.236 + 0. Za 十 0. 468 
487(C xT 
ee 口 数 是 3. 487 人 。 AS 7 
【 例 3. 3】 (已 经 整理 的 组 距 式 分 组 数值 型 数据 平均 数 算 例 ) ”根据 第 2 意 中 的 表 2 -7 
中 的 数据 资料 证 算 某 单位 某 种 产品 的 平均 销售 量 的 近似 值 。 
解 : 显然 表 2 -7 是 一 个 组 距 式 频数 分 布 表 。 列表 3 - 2 如 下 ; 


表 3-2 产品 平均 销售 量 的 辅助 计算 表 



































频率 二 x = 
按 销售 量 分 组 / 台 组 中 值 x; 频数 /天 f; 3 Bh 
1 一 1 i=l 

140~150 145 4 0.0333 4. 8285 
150 一 160 155 0. 0750 11. 625 
160 一 170 165 16 0. 1333 21. 9945 
170 一 180 175 27 0. 2250 39. 375 
180 一 190 185 20 0. 1667 30. 8395 
190 一 200 195 I 0.1417 27.6315 
200~210 205 10 0. 0833 17. 0765 
210 一 220 215 8 0. 0667 14. 3405 
220 一 230 225 4 0. 0333 7. 4925 
230 一 240 235 5 0. 0417 9. 7995 














066 | 应 用 统计 学 (第 3 版 ) »》 


由 公式 (3 -2),， 得 


一 4.8285 十 11.625 十 21.9945 十 39.375 十 30.8395 十 27. 6315 十 17.0765 十 14, 3405 
十 7.4925 十 9.7995 
一 185.003( 台 ) 


即 某 种 产品 的 平均 销售 量 是 185. 003 台 。 
0 0 


Armas 
(1) 平均 数 与 总 体 单位 数 的 积 等 于 总 体 标志 总 量 。 


(2) 若 每 个 变量 值 (z) 加 减 一 任意 常数 a， ne 和 
电 








(3) 车 每 个 变量 值 (x) 乘 以 一 任意 常数 wa， 则 莱 以 这 个 任意 值 a。 

(4) 若 每 个 变量 值 (x) 除 以 一 任意 常数 of 咒 pa 

(5) 各 个 变量 值 (x) 与 算术 平均 数 去 | Ry 

(6) 各 个 变量 值 (z) Mi he ane 差 平方 和 为 最 小 

* '. 

2. 调和 平均 数 A 

在 实际 问题 中 所 获得 的 观测 据 有 时 能 直接 采用 算术 平均 数 的 计算 公 NS 式 ， 因 
此 可 以 使 用 j 0 Mean) 的 形式 。 

1) 简单 ; 

WE 适用 于 未 经 分 组 整理 的 原 
始 数 据 资料 。 其 计算 公式 为 

H 


i 















n n 





(3-3) 





1 
| 1 1 
see 
TX 因 Xl + Ta | Th 得 Ze 


i 





2) 加 权 调 和 平均 数 
加 权 调 和 平均 数 适用 于 已 经 分 组 整理 并 编制 出 频数 分 布 的 数据 资料 。 其 计算 公式 为 




















H m1 十 Ir22 十 … 十 min Om (3-4) 
ml 平 2 Dn 外 ms; 
Tl 一 ee “Tz Th 之 zx; 
式 中 ,mi 表示 第 i 个 单位 或 第 i 组 标志 值 对 应 的 标志 总 量 。 
当 各 组 标志 总 量 相等 ， 即 二 m2 二 … 二 ma 一 m 时 ,公式 (3 一 4) 就 变 成 了 公式 (3 -3) 


的 形式 。 即 
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Dm 
芒 震 mm nn 
be mi i > SY 
wt 宕 i=l 


FE 的 数 的 变形 ， 下 面 举 例 说 明 公 式 (3 - 3) 和 公式 (3 -4) 





事实 上 ， 调和 平均 数 也 是 算术 平 
的 含义 及 应 用 。 


【 例 3. 4】 (简单 调和 平均 数 算 例 ) 








某 超市 香 攻 、 梨 、 苹 果 某 日 的 销售 价格 分 别 是 
1.5 元 / 斤 、0.7 元 / 斤 、1.2 元 / 斤 , 车 3 种 水 果 各 买 3 元 钱 


， 求 该 日 3 种 水 果 的 平均 销售 
价格 。 
解 : 从 平均 销售 价格 的 实际 意义 出 发 ， 则 平均 销售 价格 一 销售 额 / 销 售 量 ， 而 
销售 额 =3 十 3 十 3 二 3X (1 十 1 二 1)=3X3 
销售 量 一 十 7 二 1 一 x (i ws) 
故 平均 销售 价格 为 A 


也 = 销售 额 /销售 量 二 




















EE pa Le 之 1. 02439( 元 / 斤 ) 


tonite A Gk Sm 即 


n 


和 1. 02439( 元 / 斤 ) 
1 ~ | 
>— 小 1 
Te 2 








i=~17i 


【 例 3.5】( 加 权 调和 平均 数 算 例 ) CT 
所 示 ， 0 


表 3-3 某 日 3 种 水 困 销售 情况 表 


















(元 / 斤 ) 销售 额 / 元 
5 4500 
于 0.7 3500 
苹果 1.2 7200 
合计 











15200 
解 : 从 平均 销售 价格 的 实际 意义 出 发 ， 则 平均 销售 价格 二 销售 额 /销售 量 

销售 量 一 销售 领 /销售 价格 一 宇 中 十字 中 二 于 只 一 14000( 斤 ) 
故 平均 销售 价格 为 


4500 十 3500 十 7200 “15200 、， ,一 
- 14000 14000 人 1 0857( 元 / 斤 ) 


此 例题 可 直接 应 用 加 权 调 和 平均 数 公式 (3-4) 计算 ， 即 


， 而 











各 4500 十 3500 十 7200 :or 二 
下 二 二 4500 ，3500 7200 1"0857( 元 / 斤 ) 
De 0 lg 
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此 例题 车 给 出 三 种 水 果 的 销售 价格 分 别 是 1.5 元 、0.7 元 、1.2 元 ， 销 售 量 分 别 是 
3000、5000、6000 斤 ， 求 其 平均 销售 价格 ， 则 应 用 加 权 算 术 平均 数 公式 即 可 ， 即 


销售 额 Sf 1. 5X3000 二 0. 7X5000 十 1. 2X6000 
销售 量 Eh 3000 十 5000 十 6000 














1.0857( 元 / 斤 ) 

可 见 ， 采用 两 种 计算 公式 所 得 结 填 果 完全 相同 。 也 就 是 说 ， 调 和 平均 数 是 算术 平均 数 的 
另 一 种 表现 形式 ， 只 是 二 者 计算 时 使 用 了 不 同 的 数据 。 在 根据 分 组 资料 计算 平均 数 时 ， 若 

知 条 件 为 各 组 的 变量 值 (x;) 及 其 各 组 变量 值 总 和 (mm;) 时 ， 可 采用 加 权 调 和 平均 数 法 

计算 平均 数 ， 若 已 知 条 件 为 各 组 的 变量 值 (zi) 及 其 各 组 的 频数 (f;) 时 ， 可 采用 加 权 算 
术 平均 数 法 计算 平均 数 。 

3. 几何 平均 数 从 

几何 平均 数 (Geometric Mean) 的 应 用 范围 比较 罕 ， i 计算 平均 比率 和 平均 速 
度 ， 是 用 地 时 间 上 和 联系 或 有 大 忆 时 后 关 当 的 比 这 六 

1) 简单 几何 平均 数 

简单 几何 平均 数 适用 于 未 经 eh 料 。 其 计算 公式 为 


= AR Tz)* (3—6) 








2) 加 权 几 何平 均 数 
roping 其 计算 公式 为 


rh (3-7) 
人 工 而 成 。 已 知 第 一 





[ 例 3. 
道 工序 加 作为 989 第 二 we 率 为 98%， 第 三 道 工序 加 工 合格 率 为 
90%， 第 四 工 合格 率 为 93 中 ， 求 西 道 工 序 加 工 的 平均 合格 率 。 





解 : 由 公式 3-6)， 得 
WE 也 一 WTA = 0. 96X0. 98X0. 90X0.93~0. 942 
平均 合格 率 为 94. 2% 。 
【 例 3.7】 (加 权 几 何平 均 数 算 例 ) 某 农场 2003 一 2014 年 粮食 产量 增加 值 发 展 速 
度 如 表 3 -4 所 示 。 试 计算 该 农场 这 一 期 间 粮 食 产 量 增加 值 的 平均 发 展 速度 。 
表 3-4 某 农场 粮食 产量 增加 值 发 展 速 度 
































环比 发 展 速度 /% 时 期 次 数 
102 2003 一 2006 3 
104 2006 一 2011 5 
98 2011 一 2012 1 
103 2012 一 2014 2 











一 全 Vi = V1.02 X104 Xo0.98 X103 <: 102.71% 


i 第 3 章 | 069 
统计 数据 的 特征 描述 
需要 说 明 的 是 , 平均 数 是 管理 领域 中 应 用 最 广泛 的 集中 趋势 测度 值 ， 几 乎 任何 统计 推 
断 都 离 不 开平 均 数 。 平均 数 的 计算 利用 了 全 体 数据 但 却 是 一 个 容易 受到 数据 中 极端 值 影 
响 的 代表 值 ， 这 个 缺点 有 时 会 影响 平均 数 的 代表 性 。 简 单 平均 数 大 小 只 与 变量 值 的 大 小 有 
关 ; 而 加 权 平均 数 的 大 小 不 仅 受 各 组 组 中 值 大 小 的 影响 ， 还 受 各 组 变量 出 现 国光 只 回 
2 
Dl- 





的 频数 即 权 数 大 小 的 影响 。 在 这 里 ， 权 数 起 权衡 轻重 的 作用 。 如 果 某 一 组 的 
权 数 较 大 ， 则 说 明 该 组 的 数据 较 多 ,那么 该 组 数据 的 大 小 对 均值 的 影响 就 越 





大 ， 反 之 就 越 小 。 【拓展 知识 】 
八国 @ 四 和 国人 
平均 值 计算 结果 的 说 明 


(1) 根据 原始 数据 和 分 组 资料 计算 的 结果 一 般 不 会 完全 相等 ， et 
(2) 只 有 各 组 数据 在 组 内 呈 对 称 或 均匀 分 布 时 ， bi 会 与 原始 数据 的 计算 结 
> 


果 一 致 
3.1.2 众 数 NS- 


AL 
人 Made) 古 一 组 中 出 到， 一 和 用 Mo 表示。 他 
分 布 层面 看 ， 频 数 分 布 中 最 党 出 现 的 棕 冯 说 明 其 最 具有 代表 性 ， 因 此 ， 众 数 也 可 以 概括 
地 反映 全 部 数据 的 一 般 水 平 。 在 实际 记 中 ， 众 数 能 够 告诉 我 们 最 普遍 、 最 流行 的 现象 的 
特征 ， 因 而 有 助 于 进行 科学 的 凑 策 》 涂 数 主要 适用 于 分 类 数据 、 顺 序数 据 及 数值 型 数据 。 

pe et vei Mo te pet 
必须 先 对 数据 资料 进行 分 Besieged 
同 而 不 同 ， 一 般 可 以 分 为 根据 品质 型 分 组 交锋 计 众 数 、 根 据 单项 式 分 组 数据 计算 众 数 和 
根据 组 距 式 学 计算 众 数 3 种 计算 形式 > 

1. 根据 品质 型 和 单项 式 分 组 数据 计算 众 数 

这 两 种 情况 比较 简单 ， 只 需要 直接 判断 哪 一 组 的 频数 最 多 ， 该 组 的 标志 值 就 是 众 数 。 

【 例 3. 8】 (分 类 数据 众 数 算 例 ) ” 某 城 市 居民 关注 广告 类 型 的 频数 分 布 如 表 3 - 5 所 示 ， 
试 确定 广告 类 型 的 众 数 。 

表 3-5 某 城市 居民 关注 广告 类 型 的 频数 分 布 























广告 类 型 频数 /人 频率 /% 
商品 广告 112 56.0 
服务 广告 51 6 
金融 广告 9 4.5 
房地产 广告 16 8.0 
招生 招聘 广告 10 5.0 
其 他 广告 2 1.0 

合计 200 100 
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解 : 这 是 一 组 根据 分 类 数据 所 编制 的 频数 分 布 表 ， 其 分 组 标志 是 广告 类 型 。 在 表 3 -5 
中 ,居民 关注 最 多 的 广告 是 商品 广告 ,高 达 56%。 由 众 数 的 定义 可 知 , “商品 广告 ”就 是 
众 数 ， 即 Mo 一 商品 广告 。 

【 例 3. 9】( 顺 序数 据 众 数 算 例 ) ” 某 城 市 家 庭 对 住房 状况 评价 的 频数 分 布 如 表 3 -6 所 
示 ， 试 确定 家 庭 对 住房 满意 程度 的 众 数 。 


表 3-6 某 城市 家 庭 对 住房 状况 评价 的 频数 分 布 





























满意 程度 频数 / 户 频率 /% 
非常 不 满意 24 8 
不 满意 108 36 
一 般 93 31 
满意 45 本 Ks 15 
非常 满意 30 dS 10 
合计 300 a 100 
解 : 这 TO 其 分 组 标志 是 满意 程度 .在 表 3 -6 
中 ,家 庭 对 住房 状况 评价 最 多 的 是 不 满意 A 36%。 由 众 数 的 定义 可 知 ,， “不 满意 ”就 





是 众 数 ， 即 Mo= 不 满意 。 

ing 某 公司 产 荔 下 发 部 有 10 名 工作 人 员 ， 他 们 
在 该 公司 的 工作 年 限 是 2、45 加 ,3 3、2、1、5、6W BANE 他 们 工作 年 限 的 众 数 。 

解 : 这 是 一 组 未 经 整理 过 的 数值 型 数据 。 在 详 繁 俱 数 之 前 ， 先 对 数据 进行 分 组 整理 
并 编制 频数 分 布 表 坟 A 型 标志 是 工作 年 所 和 到 的 是 一 个 单项 式 数值 型 频数 分 





























布 表 。 KR 
SN 表 3-7 i 
工作 年 限 频数 /人 频率 /% 
1 10 
EE 2 20 
3 4 40 
4 1 10 
5 1 10 
6 1 10 
合计 10 100 
在 表 3 -7 中 , 工作 年 限 是 3 年 的 人 数 最 多 ， 占 40%。 由 众 数 的 定义 可 知 ， 众 数 是 4， 
即 Mo=4。 
2. 根据 组 距 式 分 组 数据 计算 众 数 


对 于 组 距 式 分 组 数据 ， 计 算 众 数 时 首先 要 确定 众 数 所 在 组 ， 即 众 数组 。 在 等 距 分 组 条 
件 下 ， 众 数组 就 是 出 现 次 数 最 多 的 组 。 然 后 通过 下 面 的 下 限 公 式 或 上 限 公式 来 计算 众 数 。 





上 限 公 式 : 


式 中 , 工 、U 分 别 
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A> 


Al 十 Az 
为 众 数组 的 下 限 和 上 限 ; A: 是 众 数组 与 其 前 一 组 的 频数 之 差 ; As 是 众 数 


Mo=U— 





xd (一 入 





组 与 其 后 一 组 的 频数 之 差 ;d 是 众 数组 的 组 距 。 


【 例 3. 11】( 组 距 式 数值 型 数据 众 数 算 例 ) 


某 商 业 银行 有 40 个 企业 贷款 ， 其 数据 整理 


如 表 3 -8 所 示 ， 据 此 计算 企业 贷款 的 众 数 。 


表 3-8 商业 银行 企业 贷款 的 频数 分 布 



































贷款 数 /万 元 在 业 数 /个 
小 于 300 < 2 
300 一 700 NA 6 

rr 
700~1100 «< NA 13 
1100 一 1500 NS i 5 
1500~1900 本 3 
1900 一 2300 SS 二 6 
2300 一 2700 、\ MN EL 
WE XXX 、 
2700 一 3100< > 了 Wy Dx 3 
PA 一 一 
3100 及 以 工 RG 1 
> 翁 计 】 | NS 40 


解 : 这 是 六 组 


x 2 
根据 组 中 式 数值 型 数 宽 所 玉 制 的 频数 分 布 表 ， 而 且 是 等 距 分 组 。 由 























表 3-8 可 以 看 出 ， 众 数组 是 700 一 1100, L=700, Al=13 一 6=7, As =13 一 5 一 8， 
d=1100 一 700==400。 
由 下 限 公 式 可 得 
4A ,7 . 
Mo=L+ A Xd 二 700 十 7 二 8X400~886. 667( 万 元 ) 
需要 说 明 的 是 ， 众 数 是 一 个 位 置 特征 数 ， 它 不 受 数据 中 极端 值 的 影响 ， 是 品质 型 数据 
集中 趋势 的 常用 测度 值 。 
3.1.3 中 位 数 
中 位 数 (Median) 是 将 一 组 数据 按 一 定 顺序 排列 后 ， 处 于 中 间 位 置 上 的 变量 值 ， 一 般 
用 Me 表示 。 中 位 数 将 全 部 数据 等 分 成 两 部 分 ,一半 数据 比 中 位 数 大 ， 另 一 半数 据 则 比 中 
位 数 小 。 中 位 数 是 位 置 代表 值 ， 它 主要 适用 于 顺序 数据 和 数值 型 数据 。 根 据 所 掌握 数据 资 





料 的 形式 ( 即 数据 资料 是 否 经 过 整理 )， 可 以 将 中 位 数 分 为 两 种 计算 形式 。 
1. 根据 未 分 组 数据 计算 中 位 数 
根据 未 分 组 数据 计算 中 位 数 时 。 先 对 数据 进行 排序 然后 确定 中 位 数 的 位 置 ， 最 后 确 


| on 
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rd 


定 中 信 





位 数 的 具体 值 。 其 公式 为 
二 





中 位 数位 置 一 (3—10) 
式 中 , 7 为 数据 的 个 数 。 若 ”为 奇数 ， ge 车 n 为 
偶数 ， 则 中 位 数 为 对 应 于 中 位 数位 置 左右 相 邻 的 两 个 数值 的 平均 值 。 


的 两 


【 例 3. 12】 (数值 型 未 分 组 数据 的 中 位 数 算 例 ) ”在 某 中 学 随机 抽取 样本 容量 为 8 和 9 
组 样本 数据 ,以 调查 教师 的 家 庭 月 收入 (单位: 元 ) 情况 。 
第 一 组 数据 : 2300，3500，2900，4500，7000，3000，8100，3200 
第 二 组 数据 : 9200，3100，2700，4600，7800，3400，2600，6700，5000 
试 分 别 计算 两 组 数据 的 中 位 数 。 
解 : 对 于 第 一 组 数据 ，n 二 8， 按 从 小 到 大 顺序 的 排序 结果 
2300 2900 3000 3200 3500 4500 7000- 
数据 位 置 ，1 2 3 4 5 56 人 8 
me ta 


Mo Ra 
对 于 第 二 组 数据 ，n 二 9， 按 从 小 到 大 顺序 的 排序 结果 为 
2600 2700 3100 3 600 5000 6700 7800 9200 
。 、 
数据 位 置 ， 1 2 3 XX™¥\ 5 6 wi 8 9 
tn 5 
. 


_ X Ss WAS E 
< 
2. 根据 分 组 数据 计算 中 位 数 不 人 
PS ee 数据 的 个 数 n 二 》)/, 即 各 组 频数 之 和 。 此 时 ， 


中 位 数位 置 一 2 (3-11) 


再 根据 累积 频数 确定 中 位 数 所 在 组 ， 





(1) 对 于 单项 式 分 组 数据 ， 确 定 中 位 数 所 在 的 组 之 后 ， 该 组 的 变量 值 就 是 中 位 数 。 
【 例 3. 13】 (顺序 数据 的 中 位 数 算 例 ) 某 高 校对 管理 学 院 大 学 一 年 级 的 高 等 数学 的 其 




















末 考 试 成 绩 进 行 抽 样 调查 ， 调 查 数据 如 表 3 - 9 所 示 。 求 学 生 考试 成 绩 的 中 位 数 。 
表 3-9 学 生 考 试 成 绩 的 频数 分 布 
考试 成 绩 学 生 人 数 / 人 向 上 累计 学 生 数 
不 及 格 30 30 
及 格 45 75 
中 93 168 
良 108 276 
优 24 300 
合计 300 一 
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解 : n= 二 300， 则 
中 位 数位 置 一 多 一 300/2 一 150 
从 向 上 累计 学 生 数 看 ， 中 位 数 应 该 在 第 三 组 ， 所 以 ，Me 二 中 。 
【 例 3. 14】 (单项 式 分 组 数据 的 中 位 数 算 例 ) ” 某 大 学 研究 生 导 师 每 年 指导 研究 生 的 人 
数 如 表 3- 10 所 示 ， 计 算 研究 生 人 数 的 中 位 数 。 
表 3-10 研究 生 人 数 的 频数 分 布 
研究 生 人 数 研究 生 导 师 数 /人 向 上 累计 向 下 累计 
1 25 25 150 
2 38 63 a 反 125 
3 56 119 AN 87 
4 21 4 31 
a 8 \ Cm 10 
6 2 XX 150 2 
合计 150 WK ~ = = 
解 : 二 150， 则 > | 党 让 
2 申 位 数位 置 = 三 E75 





无 论 从 向 Ra 数 看 ， 中 位 数 都 应 该 在 第 三 组 ， 所 以 ， 





Me 一 3 
(2) 对 于 纪 式 分 组 数据 ， op py 通过 下 面 的 下 限 或 上 限 公 式 计 
算 中 位 数 。 
下 限 公 式 : 
本 一 Se-1 
Me 一 LM 十 一 -一 Xd™e (3=12) 
fue 
上 限 公式 : 
Sw 1 
Me 一 Ux 一 下 XcM CT 和 
fue 
式 中 ,Lm 表示 中 位 数 所 在 组 的 下 限 ; Um 表示 中 位 数 所 在 组 的 上 限 ; Sm-1 表 示 向 上 累计 
至 中 位 数 所 在 组 前 一 组 的 频数 ; Sm 41 表示 向 下 累计 至 中 位 数 所 在 组 后 一 组 的 频数 ; fm 表 


示 中 





bh 位 数 所 在 组 的 频数 ; dm 表示 中 位 数 所 在 组 的 组 距 ; n 表示 各 组 频数 之 和 。 


【 例 3. 15】( 组 距 式 分 组 数据 的 中 位 数 算 例 ) 计算 例 3. 11 中 某 商业 银行 企业 贷款 的 中 


位 数 。 


解 : 根据 表 3 -8 中 的 数据 资料 ,计算 出 企业 贷款 的 累计 频数 ,如 表 3- 11 所 示 。 
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表 3-11 商业 银行 企业 贷款 的 累计 频数 表 



































贷款 数 /万 元 企业 数 /个 向 上 累计 企业 数 向 下 累计 企业 数 
小 于 300 2 2 40 
300~700 6 8 38 
700 一 1100 13 21 32 

1100 一 1500 5 26 19 

1500 一 1900 3 29 14 

1900 一 2300 6 35 11 

2300 一 2700 1 36 5 

2700 一 3100 3 39 Re SS 4 

3100 及 以 上 40 A NN 
合 计 40 ; 站 站 











一 

?一 40， 则 中 位 数位 置 一 40/2 一 20， 无 论 ,站 累计 还 是 内 向 下 累计 企业 数 看 ， 中 位 
数 都 应 该 在 第 三 组 ， 所 以 ， 中 位 数 所 在 是 网 0 一 1100。 

Le 一 700，Sw-1 一 8，Swil © 19N J 13，dw 二 1100 一 700 一 400。 由 下 限 公 
式 知 ， sh > 各 NE 

Cf GT < 

Me RR de 又 400~~1069. 23( 万 元 ) 

2 i 
需要 说 明 的 是 ， 中 位 妆 和 夫人 注定 ， 它 是 一 个 位 党 代表 值 ， 不 受 极端 值 
| 注 购 ， 特别 适宜 于 分 布 的 储 僚 程度 较 大 和 数据 中 存在 极端 值 时 的 集中 趋势 
知识 】 ”描述 。 因此， 在 统计 应 用 中 ， 通 常 利用 中 位 数 反映 收入 、 财 产 等 数据 的 集中 

趋势 。 


OOOO 


平均 数 、 中 位 数 、 众 数 的 特点 
算术 平均 数 : 四 易 受 极端 值 影响 ; @@ 数 学 性 质 优良 ， 主 要 用 于 数值 型 数据 ; 回 数 据 对 称 分 布 或 接近 
对 称 分 布 时 应 用 。 
中 位 数 : @ 不 受 极端 值 影响 ;四 数据 分 布 偏 斜 程度 较 大 时 应 用 ; 回 主 要 用 于 顺序 数据 。 
众 数 : 四 不 受 极端 值 影响 ; 加 具有 不 唯一 性 ; 轿 数 据 分 布 偏 斜 程度 较 大 时 应 用 ; 四 主要 用 于 分 类 数据 。 















【拓展 


3.1.4 分 位 数 


分 位 数 是 衡量 数据 位 置 的 测定 指标 ， 与 中 位 数 相 类 似 ， 它 可 以 将 一 组 数据 顺序 排列 
后 ， 分 割 成 4 个 、10 个 、100 个 相等 部 分 等 ， 等 分 后 各 分 位 点 上 的 值 分 别称 为 四 分 位 数 
(Quartile) 、 十 分 位 数 (Decile) 和 百 分 位 数 (Percentile) 。 分 位 数 主要 适用 于 顺序 数据 ， 
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也 可 用 于 数值 型 数据 ， 但 不 能 用 于 分 类 数据 。 这 里 ， 我 们 重点 介绍 四 分 位 数 的 计算 ， 其 他 
分 位 数 与 之 类 似 。 

四 分 位 数 就 是 一 组 数据 排序 后 处 于 25% 和 75% 位 置 上 的 值 ， 也 称 为 四 分 位 点 。 四 分 
位 数 有 3 个 ， 分 别 是 位 于 排序 数据 的 1/4、2/4 和 3/4 位 置 上 的 数值 。 显 然 ， 中 位 数 就 是 
中 间 的 四 分 位 数 。 通 常 所 说 的 四 分 位 数 是 指 处 在 1/4 位 置 上 的 数值 (下 四 分 位 数 ) 和 处 在 
3/4 位 置 上 的 数值 (上 四 分 位 数 )。 根 据 所 掌握 数据 资料 的 形式 〈 即 数据 资料 是 否 经 过 整 
理 )， 我 们 可 以 将 四 分 位 数 分 为 两 种 计算 形式 。 

1. 根据 未 分 组 数据 计算 四 分 位 数 


根据 未 分 组 数据 计算 中 位 数 时 ， 先 对 数据 进行 排序 ， 然 后 确定 四 分 位 数 所 处 的 位 置 。 


计算 公式 为 
Q 位 置 一 :2 二， 1 一 1,2， Xk、 (3-14) 
式 中 ，Q; 是 第 i 个 四 分 位 数 ,，n 是 数据 个 数 。 
若 用 Qt 表示 下 四 分 位 数 (Lower Quartile)， A < (Upper Quartile), 
则 QQ 位置 = 人 二， Qu 位 置 =3 中 SE 包 士 也 是 中 位 数位 置 。 
【 例 3. 16】 aseamaamyaaam | 计算 例 3. 12 中 两 组 数据 的 四 分 












































位 数 。 
解 : 对 于 第 一 组 数据 ， Se 
2300 2900™ he 3200 3500 4500. 7000 8100 


1 
数据 位 置 ， 1 5 汪汪 8 
Re -名 X(8 十 1) 
Qi 位 置 = 包 Re 5, qu 人 人、 2 一 3 一 6.75 
故 No 3 
‘ Qu 一 2900 十 0.25X (3000 一 2900) 二 2925( 万 元 ) 





Qu 一 4500 十 0.75X(7000 一 4500) 一 6375( 万 元 ) 
对 于 第 二 组 数据 ,nn 二 9， 按 从 小 到 大 顺序 的 排序 结果 为 
2600 2700 3100 3400 4600 5000 6700 7800 9200 
数据 位 置 。 1 2 3 4 6 7 8 9 
(nt+1)_9+1 3(n+1)_ 3X(9+1) 


@ 位 置 一 4 一 一 一 2.5，Qu 位 置 一 一 4 一 一 人 一 7.5 








QL 二 2700 十 0. 5X (3100 一 2700) 二 2900( 万 元 ) 
Qu 二 6700 十 0. 5X(7800 一 6700) 二 7250( 万 元 ) 


2. 根据 分 组 数据 计算 四 分 位 数 
根据 分 组 数据 计算 四 分 位 数 时 ,数据 的 个 数 n 二 > f, 即 各 组 频数 之 和 。 此 时 ， 首 先 








要 确定 四 分 位 数 所 在 组 ， Q 组 位 置 一 直 Qu 组 位 置 一 部 。 然后 再 根据 各 组 的 累积 频数 确 
四 分 位 数 的 具体 值 。 
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(1) 对 于 单项 式 分 组 数据 ， 确 定 四 分 位 数 所 在 的 组 之 后 ， 该 组 的 变量 值 就 是 四 分 
位 数 。 

(2) 对 于 组 距 式 分 组 数据 ， 确 定 四 分 位 数 所 在 的 组 之 后 ， 类 似 于 中 位 数 的 计算 方法 ， 
通过 下 面 的 公式 来 计算 四 分 位 数 。 

















Sm- 
QL=Li 二 oe—— Xd (3—15) 
fa 
3 
Sw 
Qu=Ls 十 xd (3—16) 
fos 


式 中 ,Li、Ls 分 别 表示 下 四 分 位 数 和 上 四 分 位 数 所 在 组 的 下 限 ; Sm -1 和 Sms-1 分 别 表示 
下 四 分 位 数 和 上 四 分 位 数 所 在 组 以 下 各 组 的 向 上 累计 频数 ; fa 和 fa 分别 表示 下 四 分 位 数 
和 上 四 分 位 数 所 在 组 的 频数 ; A 的 组 距 ; n 表示 各 组 
频数 之 和 。 

【 例 3. 17】〗 (数值 型 分 组 数据 的 四 分 位 数 算 例 ) wp 11 中 数据 的 四 分 位 数 。 

解 : 根据 表 3-8 中 的 数据 资料 ， 计 算出 企 贷款 | 向上 累计 频数 ， 如 表 3 一 12 所 示 。 


表 3-12 商业 银行 企 Ta 
贷款 数 /万 元 < 向 上 累计 企业 数 
N\2 










































































小 于 300 、 2 
\、 
300 一 700 ~ me 6 RP 8 
700~1100 rh 13 ws L 21 
1100~1500 SN 26 
一 1500 7 5 y 2 
| 5 
1500~1900YA 3 29 
1900 一 6 35 
2300 一 2700 1 36 
2700 一 3100 3 39 
3100 及 以 上 1 40 
人 台 计 40 Er 
7 一 40， Q 组 位 置 一 二 一 10， Qu 组 位 置 一 品 一 30。 从 向 上 累计 企业 数 看 ， 下 四 分 位 数 
QL 应 该 在 第 三 组 ， 即 700 一 1100; 上 四 分 位 数 Qu 应 该 在 第 六 组 ， 即 1900 一 2300 。 
Li1=700, Ls3=1100; Sm—i=8, Sw-1=29; fa=13, fa@=6; d=1100—700 
2300 一 1900 一 400。 由 公式 (3 -15) 和 公式 (3 一 16), 得 
40 
于 一 Swm- 8 
QL=Li Xd 一 700 十 X400s*761. 54 (万 元 ) 
fa 13 
3 3X40 
Sw a 29 
Qu=Ls Xd 一 1100 十 X400:1166. 67( 万 元 ) 














fos 6 
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镀 阅读 专栏 3 一 1 
如 何 看 待 和 使 用 平均 数 


平均 指标 是 反映 客观 现象 总 体 各 单位 某 一 数量 标志 一 般 水 平 的 综合 指标 ， 其 数值 表现 为 平均 数 ， 故 
又 称 统计 平均 数 。 例 如 ， 某 村 播种 冬小麦 100 亩 ， 各 个 地 块 的 小 麦 产量 是 不 同 的 ， 有 的 高 有 的 低 。 因 此 
为 了 正确 地 说 明 该 村 小 麦 产量 的 一 般 水 平 ， 就 需要 计算 诗 产 量 。 假 设 该 村 小 麦 总 产量 46000 斤 ， 则 平均 
亩 产 460 斤 。 这 460 斤 就 是 统计 平均 数 。 它 具有 两 个 特征 。 

(1) 它 用 一 个 代表 性 数值 说 明 被 研究 总 体 的 一 般 水 平 

(2) 它 把 被 研究 总 体 某 一 数量 标志 在 总 体 各 个 单位 之 问 的 差异 抽象 化 了 。 

即 把 各 个 地 块 的 小 麦 产量 在 数量 上 的 差异 给 抽象 化 了 ， 得 到 的 是 一 个 代表 该 村 小 麦 产量 一 般 水 平 的 
数值 。 * 
用 让 开本 

ie 以 总 诗 数 ， 得 到 平均 诗 产 量 。 

加 权 算术 平均 数 是 将 变量 乘 权 数 求 出 标志 总 量 ， 把 权 效 
平均 数 。 车 将 各 个 地 块 的 产量 按 不 
同 产量 水 平分 成 若干 组 ， 先 将 各 组 产量 条 以 各 组 的 地 闫 数 示 出 各 组 的 总 产 量 后 ， 相 加 求 得 全 部 地 块 的 部 
产量 ， 再 除 以 地 块 总 数 ， 则 这 ee 加权 算 术 平均 数 。 

使 用 平均 数 时 应 注意 了 解 平均 数 ep 当 数 据 
中 出 现 特大 或 特 小 值 时 ， ee 这 时 为 了 交 服 蕴 旬 数 接 盖 下 的 总 体内 部 构成 变化 的 
影响 ， per EE 
水 平 。 


总 体 总 量 ， 然 后 按 上 述 公式 计算 出 


< i A at 


例如 ， 有 ? 名 工人 生 关 入 各 产品 ， 每 个 人 的 日 所 巡 X 件 > 被 质 库 排列 为 ， 6, 6, 8, 9, ， 第 4 名 
工人 处 于 中 间 信 信 日 产量 8 件 即 为 中 位 圾 25 员 如 有 8 名 工人 ， a 6 6 8; 
9，12，14，15， 庆 单间 位 置 是 处 于 第 4 名 和 第 5 名 之 问 ， 故 中 位 数 为 (8 十 9) 二 2 二 8.5 件 。 众 数 是 总 体 


中 出 现 次 数 最 多 的 标志 值 ， 可 以 作为 总 体 一 般 水 平 的 近似 值 。 例 如 ,为 了 掌握 集 市 上 某 种 商品 的 价格 水 
平 ， 可 用 市 场 上 最 多 成 交 量 的 价格 来 代表 该 商品 的 价格 水 平 。 中 位 数 、 众 数 都 是 位 置 型 平均 数 ， 不 受 极 
端 值 的 影响 ， 当 总 体 资 料 分 布 均匀 呈 对 称 形 式 时 ， 算 术 平均 数 、 中 位 数 、 众 数 是 一 致 的 。 当 总 体 资 料 为 
非 对 称 分 布 时 ,三 者 之 间 会 产生 差异 ,分 布 偏锋 程度 越 大 ,三 者 的 差异 越 大 ， 故 中 位 数 和 众 数 不 经 党 
使 用 。 
资料 来 源 : 天 津 统计 信息 网 http: //www. stats tj. gov. cn. 
回 胡 党 加 


3.1.5 集中 趋势 各 测定 指标 之 间 的 关系 


作为 集中 趋势 测定 值 的 常用 指标 ， 众 数 、 中 位 数 和 均值 三 者 之 间 存 在 一 ” 回 
定 的 数量 关系 ， 其 数量 关系 的 体现 取决 于 资料 的 频数 分 布 。 【拓展 知识 】 
在 对 称 的 正 态 分 布 条 件 下 ,算术 平均 数 等 于 众 数 等 于 中 位 数 : 去 = Mo= Me。 在 非 对 
称 正 态 分 布 的 情况 下 ， 众 数 、 中 位 数 和 平均 数 三 者 的 差别 取决 于 偏 斜 的 程度 。 偏 斜 的 程度 
越 大 ， 它 们 之 间 的 差别 越 大 ， 偏 斜 的 程度 越 小 ， 它 们 之 间 的 差别 越 小 。 
当 频数 分 配 呈 右 偏 〈 正 偏 ) 时 ,算术 平均 数 受 极 大 值 的 影响 ， 一 般 有 元 > Me>Mo。 
当 频 数 分 配 呈 左 偏 〈《 负 偏 ) 时 ,算术 平均 数 受 极 小 值 的 影响 ， 一 般 有 二 <Me<<Mo。 
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在 数量 数据 中 ， 当 数据 呈现 对 称 分 布 或 近似 对 称 分 布 时 ， 以 算术 平均 数 作 为 集中 趋势 
的 代表 值 最 好 ; 当 分 布 的 偏 斜 程度 较 大 时 ,算术 平均 数 容易 受到 极端 值 的 影响 ， 不 能 很 好 
地 反映 数据 集中 趋势 ， 就 有 必要 考虑 使 用 中 位 数 或 众 数 。 














EMo=Me TI>Me>Mo F<Me<Mo 


图 3.1 不 同 分 布 的 众 数 、 中 位 数 和 均值 


82 高 彼 程 麻 的 拉 Ke 





数据 的 离散 程度 是 数据 分 布 的 另 一 个 重要 特 入 反 喘 的 是 各 变量 值 远 高 其 集中 站 

势 测度 值 的 程度 。 集 中 趋势 测度 值 作为 一 组 数据 的 代 委 值 ， 它 的 代表 程度 到 决 于 该 组 数据 

的 离散 程度 。 数据 的 离 做 各 太吉 大 集中 趋势 测度 值 对 该 组 数据 的 代表 性 

和 | 就 越 差 ， 离 散 程度 越 小 其 代 表 性 就 越 好 。 在 对 总 体 进行 综合 分 析 时 ， 将 

集中 趋势 测度 值 和 高 区 程度 测度 值 互相 要 互相 补充 ， 可 以 对 总 体 进行 

加 8 和 。 比较 全 面 的 观察 : 增 信 数据 的 高 艇 程度 常用 则 度 值 主要 有 极 差 、 方 差 和 
【拓展 知识 】 标准 差 。、/ 全 . 






X-- crm 
@ 旧 认 和 人 322 > 
NS P 
入 300 元 平均 工资 的 背后 


李 小 姐 有 一 个 小 工厂 ， 管 理 人 员 有 李 小 姐 、6 个 亲 咸 ; 工作 人 员 有 5 个 领 工 、10 个 工人 和 1 名 学 徒 
( 现 有 员工 工资 如 表 3 一 13 所 示 )。 现 在 工厂 需要 增加 一 个 新 的 工人 。 小 张 应 征 而 来 ， 与 李 小 姐 交谈 。 李 
小 姐 说 :“ 我 们 这 里 的 报酬 不 错 ， 平 均 工 资 是 每 周 300 元 。” 小 张 工 作 几 天 后 ,找到 李 小 姐 说 :“ 你 欺骗 了 
我 ,我 已 经 问 过 其 他 工人 ,没有 一 个 工人 的 工资 超过 每 周 200 元 ， 平 均 工资 怎么 可 能 是 一 周 300 元 呢 ?” 
李 小 姐 说 :“ 小 张 ， 平均 工资 是 300 元 , 不信, 你 看 这 张 工资 表 。” 


表 3-13 现 有 员工 工资 表 











人 员 李 小 姐 亲 威 领 工 工人 学 徒 合计 
工资 x/ 元 2200 250 220 200 100 一 
人 数 1/ 人 1 6 5 10 1 23 
J.x/ 元 2200 1500 1100 2000 100 6900 























从 工资 表 可 以 看 出 ， 该 厂 平均 工资 尽管 较 高 ， 但 由 于 个 体 工资 相差 太 大 ,平均 数 对 整 
体 的 代表 性 较 差 。 
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个 案例 说 明 在 实际 应 用 中 ， 仅 有 平均 数 是 不 够 的 ， 还 要 考虑 到 数据 的 离散 程度 。 在 
A 


3.2.1 极 差 和 四 分 位 差 











1. 极 差 (Range) 


极 差 也 称 为 全 距 ， 是 最 简单 、 最 直观 的 度量 数据 离散 程度 的 方法 ,常用 R 表示 。 根 据 
掌握 的 数据 资料 的 不 同形 式 ， 极 差 的 计算 方法 有 所 不 同 。 

1) 根据 未 分 组 或 单项 式 分 组 数据 资料 计算 极 差 

对 于 未 分 组 或 单项 式 分 组 的 数据 资料 ， 极 差 是 一 组 数据 的 最 大 值 与 最 小 值 之 差 ， 其 计 
算 公式 为 





R=max(zi)—min(zxi) I (3=17) 


2) 根据 组 距 式 分 组 数据 资料 计算 极 差 \ 
对 于 组 距 式 分 组 数据 资料 报关 也 可 以 放 刀 才 5WSN 末 组 上 限 值 一 首 组 下 限 值 。 


2. 四 分 位 差 (Quartile deviation) 


四 分 位 差 也 称 为 内 距 ， 是 下 四 分 位 数 和 六 









六 位 数 之 差 ， 常 用 Qi 表示 。 其 计算 公 
式 为 





(3—18) 
四 分 位 差 反 映 了 中 间 Si 它 不 委 秽 绒 值 的 影响 ， 在 国 可 局 回 


一 定 程度 上 克服 了 用 极 差 描述 数据 离散 程度 的 不 号 < 路 外 人 中 位 数 经 常 与 四 
分 位 差 结合 使 用 。 于 市 位 数 处 于 数据 的 中 间 位 和 _ 困 此 四 分 位 差 的 大 小 在 国名 





- 定 程度 上 也 说 明了 让 位 数 对 -组 数据 的 代表 穆 度 。 [本 全 
3.2.2 方 关怀 准 兴 个 
方差 nt 与 标准 差 (Standard Deviation) 是 测定 一 组 数据 离散 程度 的 最 常用 


的 测度 值 ， 它 反 喘 了 每 个 数据 与 其 平均 数 相 比 平均 相差 的 数值 。 方 差 是 各 变量 值 与 其 平均 
数 离 差 平 方 的 平均 数 ， 而 标准 差 是 方差 的 算术 平方 根 。 一 般 地 ,方差 用 表示 ， 而 标准 差 



































目 * 表示 。 
回 总 大 加 
根据 掌握 的 数据 资料 的 不 同形 式 ， 方差 和 标准 差 的 计算 方法 有 所 不 同 。 证， 
1. 根据 未 分 组 数据 资料 计算 方差 和 标准 差 回 
对 于 未 分 组 数据 资料 ， 方 差 和 标准 差 的 计算 公式 分 别 为 [和 和 
i 工 )2 = (> nz:) (3-19 


(3=20) 





2. 根据 分 组 数据 资料 计算 方差 和 标准 差 
对 于 分 组 数据 资料 ， 方 差 和 标准 差 的 计算 公式 分 别 为 
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EL Sa (3-21) 


(3 一 22) 








式 中 ,zz; 为 单项 式 分 组 条 件 下 的 第 i 组 的 观测 值 或 组 距 式 分 组 条 件 下 的 第 i 组 的 组 中 值 ; 





/为 第 i 组 的 频数 ;上 为 所 分 组 数 ;二 bE 为 数据 个 数 。 伦 
需要 说 明 的 是 ， 方差 和 标准 差 是 根据 全 部 数据 计算 i era 











据 的 离散 程度 。 与 方差 不 同 的 是 ， 标准 莽 症 有 计 各 ts 
因此 其 实际 意义 要 比方 差 清 楚 。 er 析 时 ， 我 们 更 多 地 使 用 标准 差 作 
为 离散 程度 的 度量 值 。 





[ 例 3.18] ee Re 方差 和 标准 差 算 例 ) 某 大 学 管理 学 
院 工商 管理 系 有 25 名 教师 ， 表 3 们 在 该 学 院 任教 年 数 的 频数 分 布 表 。 求 该 系 才 
师 在 该 学 院 任教 年 数 的 极 差 、 四 分 位 差 、 方 差 和 标准 差 守 > 、 


2 
,E14 教师 任教 年 数 sa 
ER ) RS 组 中 值 xi 
Sy ga - 
SS [ DA 3 
6~1T0 5 8 


il 1 














a 























16~20 3 18 
21~25 0 23 
26 一 30 1 28 
31 一 35 2 33 
台 计 25 





解 : 这 是 一 组 等 距 分 组 数据 资料 。 
(1) 计算 极 差 。 


极 差 R= 末 组 上 限 值 一 首 组 下 限 值 二 35 一 1 二 34( 年 


(2) 计算 四 分 位 差 。 
根据 表 3 -14 中 的 数据 资料 。 计 算出 教师 任教 年 数 的 向 上 累积 频数 。 如 表 3 -15 所 示 。 
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表 3-15 教师 任教 年 数 的 向 上 累积 频数 表 
任教 年 数 /年 人 数 fi 向 上 累计 频数 
1~5 9 9 
6~10 5 14 
1i~15 5 19 
16 一 20 区 22 
21~25 0 22 
26~30 和 23 
31~35 2 25 
合计 25 一 
0 一 25，QL 组 位 置 一 站 一 6. 25， 下 四 分 
位 数 Qt 应 该 在 第 一 组 ， oo 组 ， 即 11 一 15 


Li=1, Ls=11; Sm-i=0, s“ 4 
由 公式 (3 -15) 和 公式 (3 一 16)， 


故 四 分 位 差 T 
NY> 


根据 表 3 - 14 中 的 数据 资料 ， 











9, fo =5s 


+ xd 
XX 





X414. 8( 年 ) 





AS 


S 
Qi 二 Qu 一 Qi 二 14. 8 一 3. 8 二 11( 年 ) 
(3) 计算 方差 和 标准 差 。 


d=5—1=15—1l=4。 


计算 出 教师 任教 年 数 的 方差 的 辅助 计算 表 ， 如 表 3 - 16 


























所 示 。 
表 3-16 教师 任教 年 数 的 方差 的 辅助 计算 表 

任教 年 数 /年 人 数 万 组 中 值 x; fi 如 fi 
1~5 9 3 27 9 81 
~10 5 8 10 64 320 
11~15 5 13 65 169 845 
16~20 3 18 54 324 972 

21~25 0 23 0 529 0 
26~30 1 28 28 784 784 
31~35 2 33 66 1089 2178 
合计 2 = 280 一 5180 
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由 表 3 - 16 中 数据 ， 得 方差 为 











攻 280 
5180 25x( 仅 jj 81.76 


5| 
标准 差 为 
一 V81.76 一 9.04( 年 ) 
该 系 教师 在 该 学 院 任教 年 数 的 极 差 为 34 年 ， 四 分 位 差 为 11 年， 方差 为 81. 76 ， 
ey 9.04 年 。 


您 阅读 案例 3-3 f 


oo 
根据 美国 罗斯 杨 格 人 员 服 务 的 调查 美国 连锁店 经 理 多 生产 30000 一 62000 美元 。 某 连锁 店 老 


板 想 要 聘请 一 位 经 理 ， 那 么 该 给 经 理 多 少年 装 狗 ? ek 少 才 了 现 有 30 家 连锁店 经 理 的 年 六 数据 ( 音 
位 ; 千 美 元 ) 如 下 : 33.7 45.4 44.0 47.5 5910C4DI 37.7 43.9 48.3 53.0 39.2 42.9 
51.0 35.6 41.5 49.5 45.4 58.2 55 # 2. 32.2 5.9 47.6 56.2 48.8 31.3 51.2 
43.2 56.8 54.4。 那 么 他 是 怎样 根据 这 SS Rh 

首先 ， 他 计算 了 数据 的 平均 数 和 标准 入 一 46.9( 咎 类 元 33 人 98 ( 千 半 元 )。 全 然后 ， 他 根据 概 
率 知识 〈 即 星 正 态 分 布 的 变量 数 到 * 8 狗 亲 光 1 信 标 准 关 范 轩 内 ， 二 淹 6 
数据 落 在 平均 数 的 2 倍 标准 竟 国 内 几乎 所 有 的 数 的 3 倍 标准 差 范围 内 ) 推断 ， 关 国 连 
锁 店 经 理 中 大 约 有 68 凶 的 迁 锁 店 经 理 的 年 薪 在 38. 人 大 约 有 95% 的 连锁 店 经 理 的 年 薪 
在 30.94 一 62. 8 天 宙 全 几 竺 100% 的 过 全 证 在 22.96 一 70. 84 千 美元 。 

年 薪 的 确 a 通过 计算 平均 数 和 标准 差 ， 该 连锁 店 的 
老板 就 可 以 根据 站 已 的 实力 选择 合 送 的 年 薪 了 。 

资料 来 源 ， 于 声 涛 ， 杜 村 请. 统计 学 基础 [MJ. 北京 对 外 经 济 贸易 大 学 出 版 社 ，2005. 


3.2.3 ”变异 系数 和 异 众 比率 


1. 变异 系数 

变异 系数 〈Coefficient of Variation) 是 一 组 数据 的 标准 差 与 其 相应 的 平均 数 之 比 ， 是 
测度 数据 离散 程度 的 相对 指标 。 变 异 系数 是 一 个 无 量 岗 的 量 ， 它 适合 比较 不 同 现象 或 具有 
不 同 水 平 数据 的 离散 程度 。 变 异 系数 大 的 说 明 数 据 的 离散 程度 也 大 ， 变 异 系数 小 的 说 明 数 
据 的 离散 程度 也 小 。 其 计算 公式 为 


V 一 诗 X100% (3—23) 





【 例 3. 19】 (数值 型 数据 的 变异 系数 算 例 ) ” 某 单位 销售 部 门 所 有 职工 的 年 平均 工资 
84700 元 ， 标 准 差 为 7640 元 。 这 些 职工 的 平均 工作 年 数 为 12 年 ， 标 准 差 为 2 年 。 职 工 年 
工资 和 工作 年 数 哪 一 个 的 离散 程度 更 大 ? 
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解 : 这 是 两 个 不 同 总 体 之 间 离 散 程 度 的 比较 问题 ， 而 且 具 有 不 同 的 量 纲 。 因 此 采用 变 
异 系数 进行 比较 较为 合理 。 
7640 


Vt 交 一 亡 X100% 一 g1706 X100%~9. 02% 

















Vife4 数 一 过 X100% 一 吝 X100%~16. 67% 
说 明 职 工 工作 年 数 的 离散 程度 要 比 工资 的 离散 程度 大 。 


网 内 国 巾 才 的 





变异 系数 的 应 用 条 件 
当 所 对 比 的 两 个 数列 的 水 平 高 低 不 同时 ,就 不 能 采用 全 距 、 平 均 差 或 标准 差 百 行 对 比分 析 ， 因 为 它 
们 都 是 绝对 指标 ， 其 数值 的 大 小 不 仅 受 各 单位 标志 值 差异 程度 的 影响 ， We 
平 高 低 的 影响 ; A 须 消除 水 平 高 低 的 影响 ， 
这 时 就 要 计算 变异 系数 


2. 异 众 比率 KAN 


异 众 比率 (Variation Ratio) 是 一 组 ; Mone 也 
是 测度 数据 离散 程度 的 相对 指标 。 有 化 率 也 是 一 个 无 量 岗 的 量 ， 它 经 常 与 众 数 结合 使 
用 。Vr 越 接近 于 0， 则 说 明 众 数 的 代表 往生 好 ， ET 则 说 明 众 数 的 代表 性 越 











差 。 其 计算 公式 是 br 
及 WY, xc | 
”3 DT 
y 一 wy (3—24) 


【 例 3. 20】 NADA 计算 例 3. 10 的 异 众 比率 。 
解 :二 f=10, /一 4, 则 





pe 
Vr = 二 X 100% = 一 X100% = 60% 
2 
i=1 
告 阅读 专栏 3 一 2 
平均 和 变异 分 析 法 


平均 和 变异 分 析 法 则 是 利用 平均 指标 和 变异 指标 分 析 社 会 经 济 现象 的 一 般 水 平 及 差异 的 方法 。 
平均 指标 是 同 质 总 体 中 各 单位 某 一 指标 值 的 平均 数值 ， 反 映 总 体 在 一 定时 间 、 地 点 条 件 下 的 一 般 水 
平 ， 如 平均 工资 、 单 位 产品 成 本 、 单 位 面积 产量 、 平 均 单 价 等 。 变 异 指标 则 说 明 总 体 各 单位 标志 值 差异 
程度 的 指标 ， 常 用 的 变异 指标 是 标准 差 和 变异 系数 。 使 用 平均 和 变异 分 析 法 应 注意 以 下 几 点 : 
(1) 正确 计算 平均 指标 必须 是 同 质 总 体 的 平均 数 。 其 公式 为 
平均 指标 三 总体 各 单位 某 标志 值 总 和 /总 体 单位 数 
分 子 、 分 母 是 同一 总 体 的 两 个 总 量 指标 。 
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(2) 平均 指标 与 变异 指标 结合 运用 。 全面 认识 和 评价 总 体 ， 既 能 说 明 总 体 的 一 般 水 平 ， 又 能 说 明 总 
体内 部 差异 的 程度 。 例如， 甲 单位 月 平均 工资 1600 元 ,标准 差 为 60 元 ,变异 系数 (60 二 1600) 为 
3,75%， 乙 单位 月 平均 工资 为 800 元 ,标准 差 为 40 元 ， 变 异 系 数 为 40 二 800) 为 5%, 说 明 甲 单位 工资 
水 平 高 于 乙 单位 ， 差 异 程度 低 于 乙 单位 ,平均 工资 的 代表 性 高 于 乙 单 位 。 

(3) 用 组 平均 数 补充 总 平均 数 ， 正确 认识 总 体 结构 对 平均 水 平 的 影响 。 

(4) 结合 典型 事例 进行 分 析 。 

资料 来 源 ， 天津 流 计 信 息 网 http: //www. stats tj. gov. cn. 


3.3 分 布 形态 的 描述 


前 面 讲 的 集中 趋势 和 离散 程度 是 数据 分 布 的 两 个 重要 特征 ， 但 要 全 面 了 解数 据 分 布 的 








特点 ， 还 应 把 握 数据 分 布 的 形态 。 分形 夫人 未 妆 人 由 必 放 、、、 偏 斜 
的 程度 及 分 布 的 扁平 程度 等 。 度 和 峰 度 
3.3.1 偏 度 QA, 
偏 度 (Skewness) WE 其 计算 公式 为 
1 3 -25 
Sk= ES Oe — zs (3—25) 
式 中 ，; 为 标准 差 。 N 


(1) 当 数 据 分 布 对 称 时 ， ge 因而 偏 度 值 等 于 零 ， 
如 图 3. 2(a) 所 示 。 YX 

C2》 当 数 据 分 布 不 从 称 时 ， 偏 度 值 为 正 nna 

当 偏 度 值 为 正 植 时 ， 表 示 正 偏离 差 值 较 大 \ 可 以 判断 为 正 偏 或 右 偏 ， 偏 度 值 数值 越 
大 ， 向 右 偏 人 New 偏 度 值 为 正信 天 示 大 于 平均 数 的 标志 值 分 布 较 分 散 ， 分 布 
线 右边 拉 长 尾 色 “如 图 3. 2(b) 所 示 。 

当 偏 度 值 为 负 值 时 ， 表 示 负 离 差 数值 较 大 ， 可 以 判断 为 负 偏 或 左 偏 ， 偏 度 什 的 数值 直 
大 ， 向 左 偏 斜 的 程度 就 越 太 。 偏 度 值 为 负 值 表示 小 于 平均 数 的 标志 值 分 布 较 分 散 ， 分 布 
线 左边 拉 长 尾巴 ， 如 图 3. 2(c) 所 示 。 
































(a) 对 称 分 布 (b) 右 偏 分 布 (G) 左 偏 分 布 
图 3.2 对 称 分 布 、 右 偏 分 布 和 左 偏 分 布 示意 图 
3.3.2 峰 度 


峰 度 (Kurtosis) 是 指 一 组 数据 分 布 的 陡 缓 程度 ， 它 是 与 标准 正 态 分 布 相 比 较 而 言 的 。 
其 计算 公式 为 
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Ku — 412 m/s 3 (3—26) 
pr 


(1) 当 数据 分 布 与 标准 正 态 分 布 的 耳 缓 程度 相同 时 ， 峰 度 值 等 于 零 ， 如 图 3. 3 (a) 
所 示 。 

(2) 当 数 据 分 布 的 形状 比 标准 正 态 分 布 更 瘦 更 高 时 ， 峰 度 值 大 于 零 ， 称 为 尖峰 分 布 。 
尖峰 分 布 表 明 集 中 趋势 显著 ， 离 散 程度 低 ， 如 图 3. 3(b) 所 示 。 

(3) 当 数 据 分 布 的 形状 比 标准 正 态 分 布 更 矮 更 胖 时 ， 峰 度 值 小 于 零 ， 称 为 平 峰 分 布 。 
平 峰 分 布 表明 集中 趋势 不 显著 ， 离 散 程度 大 ， 如 图 3. 3(c) 所 示 。 























| 有 
人 
(@) 正 态 分 布 四 尖峰 分 布 /并 (中 平 峰 分 布 


A 、 
图 3.3 正 态 分 布 、 尖峰 分 布 和 平 妖 分 布 示 意图 





需要 说 明 的 是 ， 对 于 偏 度 和 峰 度 ， 由 于 评 算 比 较 烦 琐 ， 在 此 不 做 举例 说 明 。 借 助 于 计 
算 机 软件 便 可 方便 地 求 出 结果 ，S 3S 统计 分 析 软 件 就 有 此 功能 。 








A 实 疯 人 析 、 





-~ a 


在 奥运 全 办 25m 手枪 这 射 比赛 中 ， 泉 个 运动 员 首先 进行 两 个 阶段 的 预 窒 ， 然 后 根 
据 预 赛 总 成 绩 确定 进入 决赛 的 运动 员 。 进 入 决赛 的 运动 员 再 进行 两 组 每 组 10 枪 的 射击 ， 
将 预赛 成 绩 加 上 决赛 成 绩 确定 最 后 的 名 次 。 

在 2008 年 8 月 16 日 举行 的 第 29 届 北 京 奥运 会 男子 25m 手枪 速射 决赛 中 ， 获 得 前 6 
名 的 运动 员 最 后 两 组 共 20 枪 的 决赛 成 绩 如 表 3 一 17 所 示 。 




















表 3-17 第 29 届 奥运 会 男子 25m 手枪 速射 决赛 成 绩 (单位 : 环 ) 
亚历山大 。 | 拉 尔 夫 。 | 克里斯蒂 安 。| 列 昂 尼 德 + | 。 基 思 罗曼 ， 
姓 名 | 彼得 里 夫 利 许 曼 赖 茨 叶 基 莫 夫 桑 德 森 邦 达 鲁 克 
(乌克兰 ) (德国 ) (德国 ) (俄罗斯 ) (美国 ) (乌克兰 ) 
名 次 1 2 3 4 5 6 
局 10.1 8.4 9.9 8 9.7 9.8 
赛 8.4 9.6 10.7 10.7 10.5 9.2 
成 10.3 10.2 9.0 9.7 9.0 10.3 
全 10.2 10.8 10.5 9.6 9.6 生效 
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( 续 ) 
亚历山大 。 | 拉 尔 夫 克里斯蒂 安 * | 列 昂 尼 德 基 思 罗曼 
姓 ”名 | 彼得 里 夫 利 许 曼 赖 蒋 叶 基 莫 夫 桑 德 森 邦 达 鲁 克 
(乌克兰 ) (德国 ) (德国 ) (俄罗斯 ) (美国 ) (乌克兰 ) 
名 次 1 2 本 4 5 6 
10.4 10.5 10.3 10.0 9.0 9.9 
9.6 10.3 10.6 10.2 9.9 10.5 
10.1 9.8 10.0 10.1 9.2 10.4 
10.0 10.9 7.9 10.2 Y 反 97 10.9 
9.9 10.3 10.7 9.4 CY 10.5 
10.2 10.0 10.4 NM.3X | 8 10.3 
和 
10.8 9.5 9.5 4 9.3 10.2 
决 A 
10.0 10.2 9. 9 | 9.8 10.1 10.0 
Sc 
成 10.3 10.7 Co 8.9 10.5 9.8 
Wa 
绩 -= 
10.5 10.1\N| Ng.9 10.0 10.2 9.2 
一 一 - 一 -一 
9.6 bi3 YY 10. 3 » HOY 10.0 8.3 
9.8 | 9.0 WT 9.9 9.0 
i r| 4 
1074%, 9.3 ¥3 \ ” 9.5 9.5 9.4 
NGE 10.3 mS 9.8 9.7 9.8 
/9.1 10.0 10.3 10.7 9.9 10.4 
10.2 9.6 10.7 10.0 9.9 9.6 








需要 分 析 的 问题 : 

(1) 选择 适当 的 统计 量 对 上 述 数 据 进 行 描述 和 分 析 。 

(2) 对 6 个 人 的 决赛 成 绩 按 9 环 以 下 、9 一 10 环 、10 环 以 上 进行 分 组 ， 并 选择 适当 的 
图 形 对 分 组 后 的 射击 成 绩 进行 分 析 和 显示 。 

一 、 学 习 目 标 

通过 本 案例 的 学 习 ， 要 求学 生 掌握 数值 型 数据 的 一 些 描述 性 统计 量 及 其 用 途 ， 并 能 根 
据 这 些 统计 量 对 数据 进行 有 效 的 分 析 ; 掌握 使 用 图 表 显 示 分 组 数据 的 能 力 。 

二 、 案 例 分 析 

1. 6 名 运动 员 射 击 成 绩 的 统计 分 析 和 比较 

为 分 析 6 名 运动 员 的 射击 成 绩 ， 可 以 从 水 平 、 差 异 及 分 布 的 形态 等 方面 着 手 ， 分 布 计 
算 有 关 的 描述 统计 量 。6 名 选手 的 各 描述 统计 量 如 表 3 一 18 所 示 。 
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表 3-18 6 名 选手 设计 成 家 的 描述 统计 量 

样本 数 | 极 差 | 最 小 值 | 最 大 值 | 均值 | 中 位 数 众 数 

亚历山大 ， 彼得 里 夫 利 20 2.4 8.4 10.8 10.010 | 10.15 10. 30 

拉 尔 夫 ， 许 曙 20 2.5 8.4 10.9 | 10.025 | 10.15 10. 30 

克里斯蒂 安 ， 赖 茨 20 2.9 7.9 10.8 | 10.015 | 10.20 9. 90 

列 唱 尼 德 。 叶 基 莫 夫 20 1.9 8.8 10.7 9. 860 10. 00 10. 00 

基 思 。 桑 德 森 20 2.4 8.1 10.5 9. 680 9. 80 9. 90 

罗曼 。 邦 达 鲁 克 20 3.7 汪 沁 10.9 9.735 9. 85 9. 80 

统计 量 标准 差 | 方差 | 变异 系数 | 偏 度 峰 度 和 

亚历山大 。 彼 得 里 夫 利 0.5310 | 0.282 0.053 | 一 1.660 | 3.712 200.2 
拉 尔 夫 。 许 曼 0. 5794 | 0.336 0.058 | 一 1. 014 | x 200.5 
克里斯蒂 安 。 赖 区 0.7213 | 0.520 | 0.072 | 一 1. NS 21 200.3 
列 品 尼 德 ， 叶 基 葛 夫 0.5295 | 0.280 | 0.054 | 去 4 一 0.175 | 197.2 
基 思 。 桑 德 森 0.5606 | 0.314 0. 0587 Ji09 | 2.139 193.6 
罗曼 ， 邦 达 鲁 克 0.8616 | 0.742 0.D8o\ =1. 503 | 2.907 194.7 























从 各 运动 员 发 挥 的 水 平 来 看 ， 平均 其 的 是 拉 尔 夫 。 许 受 ， 为 10.025 环 ， 最 低 
的 是 基 思 ，。 桑 德 森 ， 仅 为 9. 680 环 习 而 哄 征 数 最 高 的 是 克 里 斯 带 安 。 赖 荣 ， 为 10. 20 环 ， 
最 佐 的 是 基因。 又 德 森 ， 仅 为 9.80 环 、、， 2 


从 各 运动 员 发 挥 的 稳定 性 来 看 :发挥 东 稳定 的 直下 万 山大 ， 丢 得 里 夫 利 ， 标 准 差 为 
0,5310 环 ， 变 异 系数 为 (053; 其 次 是 列 昂 尼 德 ， 咪 基 英 夫 ， 标 准 差 为 0. 5295 环 ， 变 异 
系 才 为 0.054; 发 挥 时 不 条 定 的 是 罗曼 “部 达 洛克 ， 标 准 盖 为 0.8616 环 ， 变 异 系数 为 
0. 089， 其 极 差 高 达 \ 人 7 环 。 从 最 后 的 决 壮 总 成 绩 看 ， 最 好 的 是 拉 尔 夫 。 许 曼 ， 为 200.5 
环 ， 而 最 差 的 过 尖 到 。 双 德 森 ， 仅 为 193.6 丈 。 

从 各 运动 员 射 击 成 绩 的 分 布 来 看 ， 偏 度 系数 最 小 的 是 列 昂 尼 德 。 叶 基 英 夫 ， 为 一 0. 453， 
为 轻微 左 偏 ;， 而 其 他 5 名 选手 的 偏 度 系 数 均 小 于 一 1， 有 严重 的 左 偏 。 这 说 明 运 动员 在 最 
初 几 枪 的 射击 中 ,成 绩 普遍 较 低 说明 运 动员 最 初 射击 时 有 一 定 的 紧张 情绪 。 而 后 面 的 身 
击 成 绩 较 好 ， 说 明 运动 员 的 紧张 情绪 已 经 消除 ， 逐 渐进 入 状态 。 

2. 6 名 运动 员 分 组 射击 成 绩 的 统计 分 析 和 比较 

对 分 组 数据 的 描述 适用 的 统计 量 是 频数 或 频率 。 根 据 分 析 的 目的 ， 可 以 对 每 名 运动 员 
的 成 绩 分 组 统计 (采用 上 限 不 在 内 的 原则 )， 并 列 出 频数 分 布 表 ， 如 表 3 一 19 所 示 。 


表 3-19 6 名 运动 员 射 击 成 绩 的 频数 分 布 表 




















按 射击 亚历山大 . 彼得 里 夫 利 拉 尔 夫 . 许 曼 克里斯蒂 安 。 赖 蒋 
成 绩 分 组 频数 /个 频率 /% 频数 /个 频率 /% 频数 /个 频率 /% 
9 环 以 下 5 | 5 1 5 
9 一 10 环 5 25 6 30 7 35 
10 环 以 上 14 70 13 65 12 60 
合 计 20 100 20 100 20 100 
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( 续 ) 
按 射 击 列 昂 尼 德 * 叶 基 莫 夫 基 思 。 桑 德 森 罗曼 ， 邦 达 人 鲁 克 
成 绩 分 组 频数 /个 频率 /% 频数 /个 频率 /% 频数 /个 频率 /% 
9 环 以 下 2 10 1 5 2 10 
9 一 10 环 芝 35 14 70 9 45 
10 环 以 上 11 55 5 25 9 45 
合计 20 100 20 100 20 100 
从 表 3 一 19 可 以 看 出 ， 总 成 绩 最 好 的 拉 尔 夫 ， 许 曼 所 进行 的 20 次 射击 中 ，9 环 以 下 占 





5 站 ，9 一 10 环 占 30%，10 环 以 上 占 65%; 而 总 成 绩 最 差 的 基 思 * 桑 德 森 所 进行 的 20 次 


射击 中 ，9 环 以 下 占 5 中 ，9 一 10 环 占 70%，10 环 以 上 占 25% dK 入 
要 描述 6 名 运动 员 的 成 绩 频 数 分 布 ， 可 选用 复式 条 形 图 如 图 3.4 所 示 。 
A KK 


、 ~\ \ 
口 9 环 以 下 目 9 一 10 环 口 jo 环 让 


Ne 

















射击 成 绩 
























入 9 闻 历 大 * 彼 。 拉 尔 ”克里斯蒂 列 昂 尼 德 " 叶 ” 基 思 * 柔 德 厅 ”罗曼 "部 
八 ”得 里 夫 利 。 夫 - 许 误 “ 安 " 炽 世 。 。 项 夫 达 鲁 克 


图 3.4 6 名 运动 员 射 击 成 绩 的 复式 条 形 图 


要 描述 每 名 运动 员 获 得 的 射击 成 绩 的 构成 情况 ,可 选择 饼 图 ， 如 图 3. 5 所 示 
山大 ， 彼得 里 夫 利 射击 成 绩 构 成 的 饼 图 。 





目 9 环 以 下 国 9 一 10 环 口 10 环 以 上 











目 5% 


国 25% 


口 70% 


图 3.5 亚历山大 * 彼得 里 夫 利 射击 成 绩 构 成 的 饼 图 


， 为 亚 历 


货 = 音 : 
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本 章 小 结 





利用 图 表 展 示 数据 可 以 对 数据 分 布 的 形状 和 特征 有 一 个 大 致 的 了 解 ， 但 要 全 面 把 
握 数 据 的 分 布 特征 ， 还 需要 找到 反映 数据 分 布 特征 的 各 个 代表 值 。 本 章 介 绍 了 从 三 方 


面 进 行 数据 分 布 特征 测度 和 描述 的 方法 : 集中 趋势 、 离 散 程 度 和 分 布 形态 还 介绍 了 分 
布 特征 值 的 计算 方法 、 特 点 及 其 应 用 场合 。 





关键 术语 
Central tendency 集中 趋势 Discrete Degree < 散 程度 
Mean 算术 平均 数 Harmonic wa 调和 平均 数 
Geometric mean 调和 平均 数 Mode /条 众 数 
Median 中 位 数 os 四 分 位 数 
Decile 十 分 位 数 til 百 分 位 数 
Range 极 差 NS CR 方差 


Standard deviation ”标准 差 N YNCoefficient of variation 变异 系数 
Variation ratio 异 众 出 > Skewness 次 偏 度 
Kurtosis 轿 放 7 K x XC XK| 


六 雇 链 接 > 一 x 


[1] 国家 统 六 A http: //www. stas. gov Er 
[2] 曾 卸 英 , ) 永 月 统计 基础 [MJ 北京: 机 横 工 业 出 版 社 ， 2010. 


[3] 鄙 俊 平 ， 《 何 晓 群 ， 人 金 勇 进 . 统计 学 [MD]. 6 版 . 北京 中 国人 民 大 学 出 版 社 ，2015. 





习 题 3 
一 、 选 择 题 
1. 6 个 数据 的 平均 数 为 10， 其 中 的 一 个 为 5， 那么 其 余 5 个 数 的 平均 数 是 ( hs 
A. 10 B. 9 C&T D. 12 
2. 甲 、 乙 两 个 样本 中 ， 5S 外 一 0.4，S 一 0. 2 则 两 个 样本 的 波动 情况 是 (  )。 
A. 甲 的 波动 比 乙 大 B. 乙 的 波动 比 甲 大 
C. 甲 、 乙 波动 一 样 大 D. 无 法 比较 
和 如 果 10 个 数 的 平方 和 是 370， 方差 是 33， 那 么 平均 数 是 ( 让 
A. 1 B. 2 心 ,和 D. 4 
4. 能 反映 一 组 数据 与 其 平均 数 的 离散 程度 的 是 (。”)。 
A. 极 差 和 方差 B. 极 差 和 标准 差 


C. 方差 和 标准 差 D. 以 上 都 不 对 
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5. 一 组 数据 的 方差 为 S* ， 将 这 组 数据 中 的 每 个 数据 都 乘 以 2， 所 得 到 的 一 组 新 数据 的 
方差 是 ( )s 


Ss 
2 


6. 甲 、 乙 两 人 在 相同 条 件 下 各 射 对 10 次 ， 他 们 射击 的 环 数 的 方差 分 别 为 Sh = 二 2.4， 
Sz 二 3.2， 则 射击 的 稳定 程度 是 (。”)。 


A. BE GC Bo? D. 4S2 


A. 甲 高 B. 乙 高 C. 一 样 高 D. 不 能 确定 
7. 受 极端 值 影响 最 大 的 测度 值 是 ( 

A. 极 差 B. 异 众 比率 C. 标准 差 D. 变异 系数 
8. 分 组 数据 中 ,假定 把 变量 值 所 对 应 的 频数 都 缩小 1/10， 则 加 权 平 均 数 ( ” 
A. 不 变 B. 也 缩小 1/10 C. 扩大 10 售 2 无 法 确定 
9. 一 组 数据 的 变异 系数 为 0.6， So SA 

A. 50 B. 1.7 D. 0.02 


10. 某 市 场 某 种 蔬菜 早 市 、 午 市 、 网 人 人 joe 3 元 、2 元 ， 假 定 早 
中 晚 销售 量 相同 ， 则 该 蔬菜 平均 价格 的 计算 公 RO 











1 

A. 2.5+3+2 站 a 3 和 
3 1 NA “2.5 十 3 十 2 3 

5 AS 
一 > XDA 
二 、 简 答题 ~ \ ,A 
1. 区 别 下 列 概念 。、 "人 :he 
(1) 简单 平均 数 与 加 权 平 均 数 ， A 


(2) 平均 数 ， 亲人 RS 


(3) 众 数 与 中 公有 

ee td 

(5) 标准 差 与 变异 系数 ; 

(6) 偏 度 与 峰 度 。 

2. 应 从 哪些 方面 对 数据 分 布 特征 进行 度量 ?为 什么 ? 

3. 集中 趋势 的 测度 值 有 哪些 ?各 在 什么 情况 下 使 用 ? 

4. 离散 趋势 的 测度 值 有 哪些 ? 常 使 用 哪 一 种 ? 

5. 标准 化 值 的 意义 和 用 途 是 什么 ? 

6. 某 篮 球 队 上 场 的 5 名 球员 有 4 名 在 1.9~2m， 其 中 有 1 人 身高 为 2. 4m。 要 说 明 该 
队 队 员 身 高 的 一 般 水 平 ， 用 哪 一 种 集中 趋势 的 测度 值 描述 比较 合适 ? 为 什么 ? 








1. 根据 分 组 资料 计算 得 到 的 算术 平均 数 是 一 个 近似 值 。 
2. 平均 数 的 计算 只 适用 于 数值 型 数据 。 

3. 在 描述 数据 集中 趋势 的 指标 值 中 ， 只 有 众 数 不 受 极端 值 影响 。 
4. 所 有 离散 程度 的 测度 值 都 受 极端 值 影响 。 

5. 离散 程度 的 测度 值 越 高 ,说 明 集中 趋势 测度 值 的 代表 性 越 弱 。 
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四 、 计 算 题 
1. 某 车 间 有 甲 、 乙 两 个 生产 组 ， 甲 组 平均 每 个 工作 的 日 产量 为 36 件 ， 标 准 差 为 9. 6 
件 ; 乙 组 工人 日 产量 资料 如 表 3 一 20 所 示 。 


表 3-20 乙 组 工人 日 产量 资料 


日 产量 / 件 工人 数 / 人 














15 15 
25 38 
35 34 
45 13 





(1) 计算 乙 组 平均 每 个 工作 的 日 产量 和 标准 差 。 
est nme etn 
2. 已 知 革 中 学 初中 三 年 级 1、2 两 个 班级 学 生 的 语 交 考试 志 绩 分 组 如 表 3 - 21 所 示 。 


表 3 - 21 某 中 学 初中 1、2 两 个 班级 da 
按 成 绩 分 组 /分 1 2 班 学 生 人 数 /人 


60 分 以 下 g 30 




















60~70 < NN Tso 40 

70~80 SKS ` 8g0 > 100 

80 一 90 = 50 X DS i 70 
rp Xx 

90 以 上 X 20 、r x 10 














合计 > 入) RS 250 
和 


et ri 
(2) 分 别 计算 两 班 学 生成 绩 的 标准 差 ， 比 较 两 班 学 生平 均 成 绩 的 代表 性 。 
3. 有 一 个 由 25 个 正 数组 成 的 数列 ,已 知 其 平均 数 和 标准 差分 别 为 20 和 3。 若 从 中 减 
去 一 个 为 100 的 数 ， 试 求 新 数列 的 标准 差 。 
4, 某 工厂 某 车 间 早 晚 两 班 各 有 工人 6 名 ,每 人 日 产 零件 数 如 下 : 
早 班 :6 0 13 16 19 20 
晚 班 : 9 11 12 14 18 20 
根据 上 述 资 料 ， 分 别 计算 早 、 晚 两 班 的 极 差 和 标准 差 ， 并 加 以 比较 说 明 。 
5. 已 知 下 列 每 组 数据 : 


1 人 8 10 3 2 2 80 
| L 5 
WW 1 1 人 


(1) 求 每 组 的 平均 数 。 
(2) 求 每 组 的 中 位 数 。 
(3) 求 每 组 的 众 数 。 

(4) 求 每 组 的 四 分 位 数 。 





092 | 应 用 统计 学 (第 3 版 ) »》 


6. 调查 了 某 管理 学 院 30 名 教师 ， 年 龄 如 下 : 


63 61 54 57 56 40 38 33 33 45 
28 22 23 23 24 22 21 21 45 42 
36 36 35 28 25 37 35 42 35 53 


(1) 求 样本 平均 数 、 
(2) 把 样本 分 成 组 ， 


样本 方差 、 样 本 中 位 数 、 极 差 和 众 数 。 
组 距 相同 ,作出 列表 数据 和 直方 图 。 





(3) 根据 分 纪 


数据 计算 样本 平均 数 和 样本 方差 。 





(4) 比较 (1) 和 “(3) 样本 平均 数 和 样本 方差 的 结果 ,说 明 结果 不 同 的 原 
7. 某 工厂 统计 了 100 天 内 的 不 合格 产品 如 表 3 - 22 所 示 。 


表 3-22 某 工厂 100 天 内 的 不 合格 产品 


2 4 4 


20 











不 合格 品 数 0 
天 数 





来 樟 本 平 欧 数 、 众 数 、 样 本 方差 和 样本 标准 关 。 XS- 
8. 某 公司 100 名 职工 2016 年 9 月 份 工资 数据 如 天 $- 23 所 示 。 


表 3-23 某 公司 100 名 二 2016 年 9 月份 工资 数据 
月 收入 /元 XK 人 数 /人 

















800~1300 XS \ Dwe 20 
mr 一 - 
1300 一 1800=> 了 了 NX 45 
‘ MX 
1800~2800 -x 25 
2500 以 上 区 加 100 
VY 入 5 计 } AT 100 





Q) 计算 该 公司 职工 月 工资 的 平均 数 。 

(2) 计算 该 公司 职工 月 工资 的 众 数 和 中 位 数 。 

(3) 根据 以 上 计算 的 平均 数 、 众 数 和 中 位 数 ， 分 析 该 公司 职工 月 工资 的 偏 度 特征 。 

(4) 计算 该 公司 职工 月 工资 的 标准 差 。 

9. 有 人 调查 了 465 位 篮球 运动 员 某 年 的 收入 发现 他 们 的 年 收入 以 24. 7 万 元 为 分 布 
中 心 ， 但 超过 24. 7 万 元 的 只 有 121 人 。 试 问 这 里 的 24.7 万 元 指 的 是 哪 一 种 集中 趋势 值 ? 
球员 收入 分 布 呈 什么 形态 ? 为 什么 ? 

10. 某 公 司 的 职工 月 工资 为 1000 一 5000 元 ， 现 公司 领导 决定 给 公 
资 。 如 果 给 每 位 员工 增加 300 元 ， 则 

(1) 全 体 员工 工资 的 平均 数 、 中 位 数 和 众 数 将 分 别 增加 多 少 ? 

(2) 用 极 差 、 四 分 位 数 、 方 差 和 标准 差分 别 衡量 员工 工资 的 差异 程度 ， 增 加 工资 前 后 
各 个 变异 指标 的 数值 会 有 什么 变化 ? 

(3) 增加 工资 前 后 员工 工资 分 布 的 偏 度 和 上 峰 度 有 无 变化 ? 

(4) 如 果 每 位 员工 增加 工资 的 幅度 定 为 各 自 工资 的 8%， 则 上 述 3 个 问题 的 答案 又 有 
什么 不 同 ? 





司 全 体 员 工 增加 工 
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11. 某 次 歌唱 比赛 ， 共有 9 位 评委 ， 其 中 有 歌手 甲 和 歌手 乙 分 别 得 分 情况 如 表 3 - 24 
所 示 。 
表 3-24 某 次 歌唱 比赛 歌手 甲 和 歌手 乙 的 得 分 情况 











评委 1 3 4 5 6 7 8 9 
歌手 甲 8.1 7.9 7.9 -全 8.2 LE 8.2 8.3 8.0 
歌手 乙 8.0 7.9 7.8 9.5 8.1 疏 滨 7.8 8.0 7.9 









































采用 数据 集中 趋势 的 度量 方法 ， 对 歌手 甲 和 歌手 乙 来 排名 次 ， 谁 应 该 排 在 前 面 ? 请 加 
以 讨论 。 

12. 某 管理 学 院 共 有 教师 50 人 ， 分 甲 、 乙 两 组 ， 甲 组 教师 20 人 , 平均 月 收入 78 百 
元 ,标准 差 为 8 百 元 , 乙 组 教师 30 人 ,平均 月 收入 72 百 元 ， 人 求全 院 
50 位 教师 的 平均 收入 及 标准 差 。 

13. 某 种 电器 有 两 种 型 号 ， 和 
价格 高 的 电器 的 2 倍 ， 求 这 种 电器 的 平均 销售 价格 % 

14. 某 城 市 甲 、 机 个 超 市 种 衣 订 的 从 格 和 册 区 笠 如 表 3- 25 所 示 。 


表 3-25 某 城市 甲 、 Ss 省 种 基 茉 的 价格 及 销售 资料 
销售 额 /万 元 
品 ” 种 价格 / 


wo ER 乙 超市 






































1 > lo 3 ,NT 38 
2 X GB Wr 40 80 
3 2 0.4 KI 4 45 


个 国电 人 并 说 明 原因 。 

. 某 市 场 上 有 3 种 价格 的 香 敬 ， 每 千克 分 别 为 4 元 、6 元 、10 元 , 试 计算 : 
i ey 
(2) 各 买 一 千克 ， 平均 每 千克 多 少 钱 ? 


全 实际 操作 训练 


1. 实 训 项 目 : 对 学 生 考 试 成 绩 进行 分 析 

实 训 目 标 : 掌握 统计 数据 分 布 特征 值 ， 理 解 并 会 正确 使 用 。 

实 训 内 容 : 对 自己 所 在 学 校 的 两 个 班 的 统计 考试 成 绩 进行 对 比 ， 辨 别 哪 一 个 班级 的 学 
习 程 度 好 。 要 求 : 

(1) 统计 两 个 班 的 统计 学 考试 成 绩 。 

(2) 根据 考试 成 绩 编制 频数 分 布 表 。 

(3) 计算 两 班 的 平均 成 绩 、 各 分 数 段 人 数 比 例 、 标 准 差 及 标准 差 系数 。 

(4) 对 成 绩 进行 分 析 。 

2. 实 训 项 目 : 大 学 生 身 高 的 统计 分 析 
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实 训 目标 : 掌握 统计 数据 分 布 特征 值 ， 理 解 并 会 正确 使 用 。 

实 训 内 容 : 分 成 两 个 调研 小 组 ， 分 别 对 所 在 年 级 的 同学 的 身高 进行 随机 抽样 调查 ， 要 
求 两 组 抽取 不 同样 本 容量 的 样本 。 要 求 求 出 : 

(1) 哪 一 组 调查 人 员 在 其 所 抽取 的 样本 中 得 到 的 同学 的 平均 身高 较 大 ? 或 者 这 两 组 样 
本 的 平均 身高 相同 ? 

(2) 哪 一 组 调查 人 员 在 其 所 抽取 的 样本 中 得 到 的 同学 的 身高 的 标准 差 较 大 ? 或 者 这 两 
组 样本 的 身高 的 标准 差 相 同 ? 

(3) 哪 一 组 调查 人 员 有 可 能 得 到 这 两 组 全 部 样本 的 最 高 者 或 最 低 者 ? 或 者 对 两 组 调查 
人 员 来 说 ， 这 种 机 会 是 否 是 相同 的 ? 


[人 森 例 因 考 与 讨论 , 构 
亚太 地 区 商学 院 学 生 申 请 MBA 情况 的 分 析 
卫 本 工商 人 理 索 业 较 高 的 学 历 已 是 一 种 世界 趋势 江 “4 越 来 越 多 的 亚洲 人 选 
择 就 读 工商 管理 硕士 (MBA) 学 位 ， 将 ye 在 近 一 年 来 ， 亚 太 地 区 
的 学院 里 市 请 MBA 的 人 数 清 其 了 30%， 格 物 到 站 几 区 的 74 所 商学 院 的 报道，1997 年 共 


有 170000 申请 者 竞争 1999 年 的 os 证 MBA 学 位 。 


在 整个 亚太 地 区 ， 成 千 上 万 的 时 搁置 自己 的 工作 并 花 两 年 的 时 间 来 接受 工商 



































管理 系统 教育 显示 了 日 益 增长 的 雪 ee 十 分 繁重 ， 包 括 经 济 学 、 爹 
融 学 、 市 场 营销 学 、 行为 科学 《劳工 关系 学 和 这 和 痹 学、 经 济 法 等 。 表 3 一 26 是 
Asia 公 司 提供 的 数据 ， 定 条 了 亚太 地 区 25 i 津 区 的 情况 ， 
2 表 3-26 亚太 地 区 名 商学 院 信息 统计 表 
I 
闪 忆 区 各 光 名 额 | 人 数 | 学 费 | 学 费 全 二 比例 a 工作 |/ 美 元 
/美元 | /美元 /% 测试 | 经 验 
墨尔本 商学 院 200 5 |24420 | 29600 | 28 47 是 否 是 |71400 
新 南 威尔士 大 学 228 4 19993 | 32582 | 29 28 是 否 是 |65200 
印度 管理 学 院 392 5 4300 | 4300 | 22 0 否 否 否 | 7100 
香港 大 学 90 5 11140 | 11140 | 29 10 是 和 否 否 |31000 
日 本 国际 大 学 126 4 |33060 |33060| 28 60 是 是 否 |87000 
亚洲 管理 学 院 389 5 7562 | 9000 25 50 是 否 是 |22800 
印度 管理 学 院 380 5 3935 | 16000 | 23 是 否 否 | 7500 
新 加 坡 国 立 大 学 147 6 6146 | 7170 | 29 51 是 是 是 |43300 
印度 管理 学 院 463 8 2880 | 16000 | 23 0 否 否 否 | 7400 
澳大利亚 国立 大 学 42 2 |20300 | 20300 | 30 80 是 是 是 |46600 
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( 续 ) 
gm | sm| ma | ms | | se | a5 | me | ms nm 
ed 名 额 | 人 数 | 学 费 | 学 费 a 比例 0 英语 | 工作 |/ 美 元 
/美元 | /美元 /% 测试 | 经 验 
南洋 理工 大 学 50 5 8500 | 8500 | 32 20 是 否 是 |49300 
昆士兰 大 学 138 17 | 16000 | 22800 | 32 26 否 否 是 |49600 
香港 理工 大 学 60 2 11513 | 11513 | 26 37 是 否 是 |34000 
麦 夸 里 商学 院 12 8 17172 | 19778 | 34 27 否 否 是 |60100 
Chulalongkorn 大 学 200 17355 | 17355 25 6 否 是 |17600 
Monash Mt Eliza 商学 院 | 350 13 | 16200 | 22500 | 30 SN 是 是 |52500 
亚洲 管理 学 院 300 | 10 |18200 | 18200 Sh 上 | 否 | 是 | 是 |25000 
阿 德 莱 德 大 学 20 19 | 16426 | 23100 Keoi 10 查 耕 是 |66000 
梅 西 大 学 30 15 13106 eh 35 否 是 是 |41400 
墨尔本 皇家 工商 学 院 30 7 | 13880 i 32 30 否 是 是 |48900 
JamnalalBaja 管理 学 院 240 9 oon [1 000 24 _0 否 否 是 7000 
柯 延 理工 学 院 98 | 15™ hghzs [19097 是 | 否 | 是 |55000 
拉 合 尔 管理 科学 院 70, | WH 11250 | 26300 否 否 否 “| 7500 
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要 求 对 该 锯 做 出 分 析 关 写 出 分 析 报告 ， 分 析 报 告 应 包括 : 
(1) 用 描述 统计 的 方法 概括 表 中 数据 ， 并 讨论 你 的 结论 ; 
(2) 对 变量 数据 的 最 大 值 、 最 小 值 、 平 均 数 及 适当 的 分 位 数 进行 评价 和 解释 ; 通过 这 


些 描述 统计 量 ， 你 对 亚太 地 区 的 商学 院 有 何 看 法 或 发 现 ? 
(3) 对 本 国学 生 学 费 和 外 国学 生 学 费 进行 比较 ; 
(4) 对 要 求 或 不 要 求 工作 经 验 的 学 校 学 生 的 起 薪 进 行 比较 ; 

(5) 对 要 求 或 不 要 求 英语 测试 的 学 校 学 生 的 起 薪 进 行 比较 ， 
(6) 为 了 便于 反映 你 希望 反映 的 问题 ， 请 在 分 析 报告 中 添加 必要 的 图 表 。 
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常见 统计 软件 简介 


SPSS 的 全 称 是 Statistical Product and Service Solutions， 即 “统计 产品 与 服务 解决 方案 ”软件 ， 它 是 
国际 上 最 有 影响 的 三 大 统计 软件 之 一 ， 由 美国 SPSS 公司 于 20 世纪 70 年 代 推 出 。2009 年 ，SPSS 公司 宣 
布 重新 包装 旗下 的 SPSS 产品 线 ， 定 位 为 预测 统计 分 析 软 件 (Predictive Analytics Software，PASW)， 软 
件 以 PASW Statistics 为 名 ,同年 被 IBM 公司 以 12 亿美 元 现金 收购 ， 自 2010 年 8 月 发 行 19.0 开始 ， 
SPSS 正式 更 名 为 IBM SPSS Statistics (本 书 均 简称 “SPSS”)。 迄 今 ，SPSS 公司 已 有 40 余年 的 成 长 
历史 。 

S-PLUS 基于 S 语 言 ， 并 由 Wanhsot 生计 和 一 上 和 和 诗人 
员 的 通用 方法 工具 箱 ，S- PLUS 强调 演示 图 形 、 探 索性 数据 分 析 、 法 SN 开发 新 统计 工具 的 计算 方 
法 ， 以 及 可 扩展 性 。S- PLUS 有 微机 版 本 和 工作 站 版 本 ， 它 是 件 ， 可 以 直接 用 来 进行 标准 的 
统计 分 析 得 到 所 需 结果 ， tanner nasa 并 可 以 很 
容易 地 实现 一 个 新 的 统计 方法 。 NN 

及 软件 是 S 语 言 的 另 一 个 实现 版 本 。R 的 使 用 与 x S 有 很 多 类 似 之 处 ， 这 两 种 语言 有 一 定 的 兼 
容 性 。S- PLUS 的 使 用 手册 ， 只 要 稍 加 修改 的 使 用 手册 。 所 以 有 人 说 , 有 是 S- PLUS 的 一 
个 “克隆 "。 但 S- PLUS 是 收费 的 ，R 是 一 人 免费 、 闪现 于 订 的 次 从， 它 是 一 个 用 于 统计 计算 
和 统计 制图 的 优秀 工具 ， 近 几 年 使 用 

AS AA nd 党 最 早 由 北 卡 Rh 的 两 位 生物 统计 学 研究 生 编 制 ， 
并 于 1976 年 成 立 了 SAS 软件 研究 所 $ 开始 进行 SAS en 开发 、 销 售 和 培训 工作 ， 期 间 经 历 了 
许多 版 本 。 i SAS 系统 在 国 为 统计 分 析 的 标准 软件 ， 在 各 个 领域 得 
到 广泛 应 用 。 了 

won 公司 1981 年 发 行 第 1 瞳 答 Micro TSP 的 Windows 版 本 ， 通 常 称 为 计量 经 济 学 
软件 包 。EVie conometrics Views 的 缩写 ， 它 的 本 意 是 对 社会 经 济 关系 与 经 济 活动 的 数量 规律 ， 采 
用 计量 经 济 学 方法 与 技术 进行 “观察 ”。 使 用 EViews 软件 包 可 以 对 时 间 序 列 和 非 时 间 序 列 的 数据 进行 分 
析 ， 建 立 序列 (变量 ) 间 的 统计 关系 式 ， 并 用 该 关系 式 进 行 预测 、 模 拟 等 。EViews 处 理 非 时 间 序 列 数据 
照样 得 心 应 手 。 实 际 上 ， 相 当 大 型 的 非 时 间 序 列 (截面 数据 ) 的 项 目 也 能 在 EViews 中 进行 处 理 。 

Stata 是 一 套 提供 其 使 用 者 数据 分 析 、 数 据 管理 及 绘制 专业 图 表 的 完整 及 整合 性 统计 软件 。 它 提供 许 
多 功能 ， 包 含 线性 混合 模型 、 均 衡 重复 反复 及 多 项 式 普 罗 比 模式 。 新 版 本 的 Stata 的 窗口 接口 ， 使 用 者 自 
行 建立 程序 时 ， 坎 件 能 提供 具有 直接 命令 式 的 语法 。 

Statistica 为 一 套 完整 的 统计 资料 分 析 、 图 表 、 资 料 管理 、 应 用 程式 发 展 系统 ， 以 及 对 其 他 技术 、 工 
程 、 工 商 企业 资料 挖掘 应 用 等 进 阶 分 析 的 应 用 程式 。 此 系统 不 仅 包含 统计 上 一 般 功能 及 制图 程序 ， 还 包 
会 特殊 的 统计 应 用 (如 社会 统计 人 员 、 生 物 研 究 员 或 工程 师 )。 全 新 的 Statistica 在 功能 上 更 提供 了 四 种 
线形 模型 的 分 析 工 具 , 包括 VGLM、VGSR、VGLZ 与 VPLS。 对 使 用 者 而 言 ， 提 供 完整 且 具 可 选择 性 的 
使 用 者 界面 ; 方 可 广泛 使 用 程式 语言 辅助 精灵 来 建立 一 般 的 范围 ， 或 整合 Statistica 与 其 他 应 用 程式 进行 
计算 ， 这 些 都 是 非常 方便 好 用 的 模 组 。Statistica 能 提供 使 用 者 所 有 需要 的 统计 及 制图 程序 。 另 外 ， 能 够 在 
图 表 视 窗 中 显示 各 种 分 析 ， 以 及 有 别 于 传统 统计 范畴 外 的 最 新 统计 作 图 技术 ， 皆 获得 许多 使 用 者 的 好 评 。 

在 对 数据 进行 处 理 时 ， 大 多 是 使 用 简单 统计 描述 ， 画 各 种 统计 图 表 ， 或 者 进行 上 检验 、 方 差分 析 、 
相关 分 析 及 回归 分 析 。 做 这 些 统计 分 析 时 ， 大 多 可 使 用 Windows 下 的 Excel。Excel 是 一 种 使 用 极 方便 的 
电子 表格 软件 ， 它 有 强大 的 数据 管理 功能 ， 能 制作 各 种 统计 图 表 ， 具有 丰富 的 财会 和 统计 函数 ， 并 且 
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Excel 在 “分 析 工 具 库 ”中 提供 了 一 组 数据 分 析 工 具 。 使 用 这 些 分 析 工 具 时 ， 只 需 指 出 数据 所 在 的 单元 格 
和 提供 必要 的 参数 ， 该 工具 就 会 使 用 适宜 的 统计 或 工程 函数 ， 对 数据 做 处 理 ， 给 出 相应 的 结果 。 有 些 工 
具 在 输出 时 还 能 产生 图 表 。 


SPSS 软件 包 集 数据 整理 、 分 析 过 程 、 结 果 输 出 等 功能 于 一 身 ， 数 据 处 理 速度 快 ， 功 
能 强大 ， 窗 口 操作 人 性 化 、 简 单 化 ， 因 此 使 用 较 普 及 。 本 章 针 对 本 书 中 所 涉及 的 统计 学 内 
容 ， 简 明 地 介绍 IBM SPSS Statistics 22. 0 中 常用 统计 分 析 方 法 的 操作 步骤 和 输出 结果 的 
解释 ， 使 读者 很 快 实现 对 SPSS 功能 的 基本 掌握 和 应 用 。 


4.1 IBM SPSS Statistics 22. 0 的 界面 
人 


4.1.1 SPSS 的 主 窗口 (AX . 
RN 





[拓展 知识 】 IBM SPSS Statistics 22. 0 的 启 动 方法 向 三 般 常用 软件 的 启动 执行 方法 完 
全 相同 ， 只 需 按 以 下 顺序 操作 即 可 六 开始 一 程序 一 IBM SPSS Statistics 22。 

启动 IBM SPSS Statistics 22 后 ， 弹 出 一 一 个 选择 对 请 框 ， 可 以 选择 打开 已 经 存在 的 数据 文 
件 ， 也 可 以 做 出 其 他 选择 。 弹 出 对 话 杠 迁 而 坝 F: 

(1) New Files: 新 建文 件 。 \ <N 厂 

(2) Recent Files: 最 近 的 文件、 入 XI 

(3) What's News: 新 增 功 能 ， - Wz 以 

(4) Modules and Programmmiability， 模块 和 可 请 起 性 。 

(5) Tutorie alss 数 程 | NA NS 

(6) show this dialog in the fi 痊 运 行 SPSS 系统 时 不 显示 该 对 话 框 ， 直 接 
tm > 

在 做 出 选择 后 单 击 “OK” 按钮， 或 直接 单 击 “Cancel” 按 钮 ， 就 可 进入 SPSS 的 数据 
编辑 窗口 。 


4.1.2 数据 编辑 窗口 


数据 编辑 窗口 (IBM SPSS Statistics Data Editor) 也 称 数 据 编 辑 器 ， 是 一 个 典型 的 
Windows 软件 界面 ， 从 上 到 下 由 标题 栏 、 菜 单 栏 、 工 具 栏 、 数 据 编 辑 区 和 系统 状态 显示 区 
5 部 分 组 成 。 该 界面 和 Excel 极为 相似 ， 由 若干 行 和 若干 列 组 成 ， 每 行 对 应 了 一 个 观测 记 
录 ， 每 列 则 对 应 了 一 个 变量 。 

1. 标题 栏 

标题 栏 显 示 了 打开 的 数据 文件 名 。 

2. 菜单 栏 

菜单 栏 将 SPSS 常用 的 数据 编辑 、 加 工 和 分 析 的 功能 列 了 出 来 ,使 用 者 可 根据 自己 的 
需求 在 打开 的 子 菜单 中 选择 需要 的 选项 ， 完 成 特定 的 功能 。 菜 单 栏 的 名 称 及 作用 如 下 ; 

(1) File: 文件 操作 。 完 成 文件 的 打开 、 新 建 、 保 存 、 打 印 和 关闭 等 操作 。 
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(2) Edit: 文件 编辑 。 完 成 文本 或 数据 内 容 的 选择 、 复 制 、 剪 贴 、 查 找 和 替换 等 
操作 。 

(3) View: 浏览 编辑 。 完 成 文本 或 数据 内 容 的 状态 栏 、 工 具 栏 、 字 体 、 网 格 线 和 数 
值 标签 等 功能 的 操作 。 

(4) Data: 数据 管理 。 完 成 数据 变量 名 称 和 格式 的 定义 ， 数 据 资料 的 选择 、 排 序 、 加 
权 ， 数 据 文件 的 转换 、 连 接 和 汇总 等 操作 。 

(5) Transform: 数据 转换 。 完 成 数据 的 计算 、 重 新 编码 和 缺失 值 蔡 代 等 操作 。 

(6) Analyze: 数据 分 析 。 完 成 基本 统计 分 析 、 均 值 比 较 、 相 关 分 析 、 回 归 分 析 、 聚 
类 分 析 、 因 子 分 析 、 对 应 分 析 等 一 系列 统计 分 析 方 法 的 选择 与 应 用 。 

(7) Direct Marketing: 直销 。 提 供 了 一 组 精心 设计 以 改善 直销 活动 效果 的 工具 ， 它 
可 以 标志 那些 用 于 定义 不 同 消费 者 群体 的 人 口 统计 学 、 购 买 和 其 他 特征 ， 针 对 特定 日 标 群 
体 最 大 限度 地 提高 正面 响应 率 。 < KY 

(Greghe 仙 作 统计 轩 形 。 完 成 条 形 图 、 儿 轩 、 计 和 六 各 用 统计 图 形 的 人 人 
与 编辑 。 ,六 
(9) Utilities 实用 程序 。 有 关 命 令 解释 、 字 体 洗 返 、 文 件 信 息 、 定 义 输出 标题 和 窗 
口 设计 等 。 NAN 

(10) Add- ons: 插件 。 可 添加 其 他 应 用 程序 ， 可 提供 服务 帮助 ， 可 编程 延续 。 

(11) Window: 窗口 控制 。 可 进行 窗 记 的 排列 、 选 择 和 显示 等 。 

(12) Help: 帮助 。 帮 助 文件 的 调用 、 查 询 和 显示 等 操作 、 

3. 工具 栏 a x 

工具 全 示 了 常用 的 能 央 开 按 锯 ， 使 用 半生 近日 击 菜 个 接 包 完成 相应 的 功能 
使 操作 更 加 快捷 方便 人 ~ x 

De 六 

4， 数据 纺 

数据 编辑 区 是 显示 和 管理 SPSS 数据 结构 和 数据 内 容 的 区 域 。 它 的 左下 方 是 窗口 切换 
标签 区 ， 包含“Data View” 和 “Variable View” 两 个 标签 。“Data View” 指 数据 视 区 ， 
显示 具体 的 数据 内 容 ， 可 以 输入 编辑 数据 ; “Variable View” 指 变量 视 区 ,显示 数据 文件 
中 变量 的 定义 ， 包 括 变量 的 名 称 、 类 型 、 宽 度 、 小 数 点 位 数 等 。 

5. 系统 状态 显示 区 


系统 状态 显示 区 显示 系统 当前 的 运行 状态 。 当 系统 等 待 使 用 者 操作 时 , 会 出 现 “IBM 
SPSS Statistics Processor is ready” 的 提示 信息 ,该 信息 可 以 作为 检查 SPSS 是 否 成 功 安装 
和 正常 启动 的 手段 。 





















































4.2 建立 数据 文件 


通常 进行 一 项 统计 工作 时 ,数据 是 新 的 数据 ,可 以 直接 从 SPSS 数据 编辑 窗口 输入 。 
直接 从 SPSS 数据 编辑 窗口 建立 数据 文件 的 方法 : 首先 应 该 给 新 的 数据 文件 进行 变量 定 
义 ， 然 后 使 用 者 就 可 以 逐个 录入 数据 。 
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4.2.1 变量 的 定义 


单 击 “Variable View” 标 签 ， 定 义 变量 (不 要 忘 了 保存 )。 下 面 介 绍 各 变量 的 功能 。 

(1) Name: 变量 名 称 。 其 总 长 度 不 能 超过 64 个 字符 (32 个 汉字 )。 定 义 变量 名 应 
注意 : 

@ 第 一 个 字符 必须 是 字母 或 字符 @、# 或 帅 之 一 。 

@ 后 续 字 符 可 以 是 字母 、 数 字 、 非 标点 字符 和 句点 (. ) 的 任意 组 合 。 

句 变量 名 称 不 能 包含 空格 。 

@ 变量 名 称 第 一 个 位 置 中 的 # 字 符 将 变量 定义 为 临时 变量 ;只 能 使 用 命令 语法 创建 
临时 变量 ;不 能 在 创建 新 变量 的 对 话 框 中 将 变量 的 第 一 个 字符 指定 为 # 。 

回 第 一 个 位 置 中 的 $ 符 号 表示 变量 为 系统 变量 。 2 





一 个 字符 。 So 

@ 可 在 变量 名 称 中 使 用 句点 、 下 夯 线 和 字符 币 、## GN 

@ 应 避免 用 句点 结束 变量 名 称 ， 因 为 句点 可 能 被 解释 为 命令 终止 符 。 只 能 使 用 命令 
语法 创建 以 句点 结束 的 变量 ; 不 能 在 创建 新 变 和 的 对话 中 创建 以 句点 结束 的 变量 。 

@ 应 避免 使 用 下 面 线 结束 变量 名 称 ， 为 这 样 的 名 称 可 能 与 命令 和 过 程 自动 创建 的 
变量 名 称 冲突 。 4 

9 不 能 将 保 贸 关键 字 用 作 变 量 改称 } 保留 关键 字 有 ALL、AND、BY、EQ、GE、 
GT、LE、LT、NE、NOT、QRSNN 和 WITH。 XA 

加 可 以 用 任意 混合 的 大 小 写字 符 来 定义 变量 名称 5- 大 小写 将 为 显示 目的 而 保留。 

(2) Type: 变量 类 再 。 单 击 变量 类 型 ， hu Type” 对 话 框 ， 有 9 种 类 型 
可 供 选 择 ， 分 别 如 于 3 AN 

Q@ Numeric: 标准 数值 型 。 是 系统 默认 人 的 变量 类 型 ， 默 认 总 长 度 为 8 位 ， 小 数 是 2 
位 。 使 用 时 可 调 ， 小 数位 数 。 这 种 变量 类 型 最 为 党 用。 例如， 原始 数据 235. 66 表示 成 标 
准 数值 型 仍 为 235. 66。 

四 Comma: 带 逗 号 的 数值 型 。 整 数 部 分 从 右 向 左 每 3 位 一 个 逗号 ， 其 余 同 数值 型 变 
量 。 例如， 原始 数据 6789401 表示 成 带 逗 号 的 数值 型 为 6，789，401。 这 种 变量 类 型 不 
常用 。 

图 Dot: 带 句号 的 数值 型 。 以 整数 形式 显示 数据 ， 从 右 向 左 每 3 位 一 个 圆 点 (但 不 是 
小 数 点 )， 应 用 逗号 表示 小 数位 置 ， 但 都 显示 0; 其 余 同 数值 型 变量 。 例 如 ， 则 原始 数据 
4. 5895 表示 成 带 句号 的 数值 型 为 45. 895，00。 这 种 变量 类 型 不 常用 。 

加 Scientific notation: 科学 计数 型 。 例 如 ， 原 始 数据 1231. 3 表示 成 科学 计数 型 为 
1. 2E 十 003。 

@@ Date: 日 期 型 。 使 用 者 可 以 从 系统 提示 的 日 期 显示 形式 中 选择 自己 需要 的 。 例 如 ， 
选择 mm/dd/yyyy 形式 ， 则 2006 年 11 月 1 日 显示 为 11/01/2006。 

@ Dollar: 带 美元 符号 的 数值 型 。 在 有 效 数字 前 带 有 “下 ”符号 ， 其 余 规定 与 标准 数 
值 型 相同 。 例 如 ， 原 始 数 据 67. 89 表示 成 带 美元 符号 的 数值 型 为 $67. 89 。 

@ Custom Currency: 自 定义 型 。 机 器 自动 提示 选择 方法 。 

String: 字符 串 型 。 选 中 该 项 后 ， 使 用 者 可 以 在 数据 输入 时 输入 中 文 或 英文 符号 。 
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图 Restricted Numeric (integer with leading zeros): 受 限 数值 。 值 限于 非 负 整数 的 变 
量 。 在 显示 值 时 ， 填 充 先导 0 以 达到 最 大 变量 宽度 。 假 定数 据 宽 度 设 为 4， 则 “221133” 
显示 为 “1133”， 而 “22” 显 示 为 “0022”。 

(3) Width: 数据 或 字符 串 的 宽度 ， 默 认 的 变量 长 度 是 8 位 。 当 变量 为 某 些 特定 类 型 
时 ， 该 设置 无 效 ， 如 日 期 型 变量 。 

(4) Decimals: 小 数位 数 。 默 认 的 小 数位 数 是 2 位 。 

(5) Label: 变量 标签 。 用 来 说 明 变 量 所 代表 的 实际 意义 ,可 以 输入 120 个 字符 。 由 
于 变量 名 常用 英文 字母 加 数字 来 表示 ， 因 此 对 变量 名 的 具体 意义 做 进一步 的 附加 说 明 很 重 
要 ， 建 议 使 用 中 文 标签 。 例 如 ， 在 定义 “性 别 ” 这 个 变量 时 ， 可 以 用 Sex 表示 其 名 称 ， 输 
入 “性 别 ”作为 其 标签 。 

(6) Values: 变量 值 标签 。 对 变量 可 能 取 值 附加 的 进 一 给 By 总 分 类 变量 往往 要 定 
义 其 取 值 的 标签 。 例 如 ， 在 统计 中 性 别 变 ae 0 
定义 其 取 值 的 方法 是 ， 芝 直 ， “Values” 按钮 ， 弹 出 ， 0 对 话 杠 ， 在 第 一 个 
“Value” 编 辑 框 输入 数值 “1”， 在 第 二 人 家 辑 框 输入 标签 “ 男 "， 单 击 “Add” 
按钮 确认 ， 即 可 定义 “1 一 4 Ce 来 定义 其 他 变量 的 取 值 ， 最 后 单 
击 “OK” 按 钮 即 可 。 

(7) Missing: 缺失 值 。 缺失 值 的 食 久 是 是 猪 狂 调查 a 实验 当中 因为 被 调查 者 不 愿意 回 

答 或 其 他 原因 导致 数据 的 缺失 。 为 工 保证 分 本 结果 的 合理 性 ， 不 希望 计 
分 析 。 在 SPSS 的 数据 表 上 任 闪 站 安 和 的 单 天 et kh 
失 值 的 定义 方法 如 下 : 。 ”二 

单 击 “Missing” 按 二 “Missing Vi 对 话 棋 ， 内 有 3 个 单 选 接 包 。 

ONo missing>values: 没有 缺失 值 。 是 系 默认 选项 。 

回 Discrete missing values: 离散 缺失 值 志 对 于 离散 型 缺失 值 ， 可 以 定义 1 一 3 个 单一 
数据 为 缺失 什 S\ 竺 机 遇 到 这 些 缺 失 值 会 作为 特殊 值 处 理 ， 计 算 时 跳 过 。 例 如 ， 人 的 性 别 
的 数据 资料 ， 若 规定 男 为 1、 女 为 2， 则 值 为 0。3、4 都 被 认为 是 非法 的 。 如 果 将 这 3 个 
值 分 别 输入 到 3 个 和 矩形 框 中 ， 当 数据 文件 出 现 这 几 个 数据 时 ， 系 统 将 按 缺 失 值 处 理 。 

加 Range plus one optional discrete missing value: 定义 缺失 值 范 围 。 指 定 范围 为 缺失 
值 ， 同 时 指定 另外 一 个 不 在 这 一 范围 内 的 单一 数 为 缺失 值 。 这 种 方式 定义 缺失 值 主 要 是 针 
对 连续 变量 的 值 。 例 如 ， 如 果 定 义 变量 “身高 ”的 值 中 输入 的 错误 数据 有 1. 40、1. 90、 
1.95 和 2.03， 而 且 在 1.90 一 2.03 没有 正确 的 身高 测试 值 ， 正 确 值 在 大 于 1.40 和 小 于 
1. 90 的 范围 内 ， 则 可 选择 此 种 定义 缺失 值 的 方式 。 在 “Low” 人 参数 框 中 输入 1.90， 在 
“High” 参 数 框 中 输入 2. 03. 在 “Discrete value” 参 数 框 中 输入 1. 40。 此 外 ， 多 于 3 个 缺 
0 量 也 可 以 用 此 方式 定义 缺失 值 。 例 如 ， 对 于 “性 别 ” 变 量 值 ， 如 果 规 定 男 为 
、 女 为 2， 在 输入 时 输入 了 3、5、6、9， 可 以 在 “Low” 参 数 框 中 输入 3， 在 “High” 参 
ge 9。 

需要 说 明 的 是 ， 用户 缺失 值 和 系统 缺失 值 的 含义 不 同 ， 系 统 缺 失 值 主要 是 指 计算 机 默认 
的 缺失 方式 ， 如 果 在 输入 数据 时 空缺 了 某 些 数据 或 输入 了 非法 的 字符 ， 计算 机 就 把 其 界定 为 
缺少 值 ， 这 时 的 数据 标记 为 “.”， 而 用 户 界定 的 缺失 值 则 不 会 在 数据 显示 时 出 现 “.” 

(8) Columns: 显示 数据 的 宽度 。 定 义 数据 在 屏幕 上 该 变量 对 应 列 的 显示 列 宽 。 默 认 
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值 为 8 个 字符 ， 范 围 是 1 一 255。 显 示 宽 度 不 影响 机 内 值 和 分 析 运 算 结 果 ， 只 影响 显示 。 

(9) Align: 字符 排列 方向 。 定 义 数据 在 单元 中 的 对 齐 方式 ， 有 3 种 选择 ， 即 左 对 齐 
(Left) 、 右 对 齐 (Right) 和 居中 (Center)。 

(10) Measure: 数据 测量 类 型 。 它 是 指 变量 是 如 何 测量 的 ， 可 有 3 种 选择 。 

Q@ Scale: 尺度 变量 〈 连 续 变量 )。 是 默认 的 类 型 ， 即 使 用 距离 或 比率 量 尺 测量 的 数 
据 ， 如 身高 和 体重 。Scale 可 以 是 数值 型 、 日 期 型 和 货币 型 变量 ， 但 不 能 是 字符 串 型 变量 。 

@ Ordinal: 顺序 变量 。 是 指 变量 之 间 的 顺序 有 实际 意义 ， 但 没有 距离 关系 。 顺 序 变 
量 可 以 用 有 序 的 数字 作为 代码 ， 设置 了 值 标签 的 变量 被 认为 是 有 序 的 分 类 变量 ， 可 以 作为 
分 组 变量 ， 也 可 以 参与 某 些 分 析 过 程 的 运算 。Ordinal 可 以 是 数值 型 和 字符 串 型 变量 。 

加 Nominal: 分 类 变量 。 分 类 变量 值 之 间 没 有 顺序 关系 ， 只 能 作为 分 组 变量 使 用 。 
Nominal 与 Ordinal 一 样 ， 只 是 不 要 求 变量 有 次 序 关 系 。 伦 

















(11) Role: 角色 ， 可 有 6 种 选择 。 

Q@ Input: 输入 。 变 量 将 用 于 输入 〈 如 预测 变量 、 aa 

@ Target: 目标 。 变 量 将 用 于 输出 或 目标 wh 

名 Both: 两 者 。 变 量 将 同时 用 于 输入 和 输 : SS 

@ None: 无 。 变 量 没有 角色 分 配 。 

@ Partition: 分 区 。 enn 为 单独 的 训练 、 检 验 和 验证 样本 。 

@ Split， 拆 分 。 设 定 此 角色 是 为 与 @ SPSS@ Modeler 相互 兼容 。 具 有 此 角色 的 
变量 不 会 在 IBM SPSS Sen 昌文 人 变量 。 2 


4.2.2 数据 的 输入 A X el 以 


单 击 “Data VieW” 标签 ， 直 接 从 数据 编 ns SPSS 数据 输入 的 操作 过 程 
与 Excel 基本 ae 行 录 入 的 。 
录入 数据 时 应 前 先 确定 当前 数据 单元 ; 针 将 光标 指 到 革 个 数据 单元 上 ， 然 后 单 击 。 数 
据 录 入 可 以 逐 行进 行 ， 录 入 完 一 个 数据 后 按 Tab 键 ， 于 是 当前 单元 的 右边 一 个 单元 便 自动 
Ne. 数据 录入 可 以 逐 列 进行 ， 录 入 完 一 个 数据 后 按 Enter 键 ， 于 是 当前 单元 的 
一 个 单元 便 自 动 成 为 当前 单元 。 如 果 数 据 已 经 输入 成 表格 或 Excel 文件 ， 则 可 以 复制 
ee 


4.2.3 数据 的 编辑 


SPSS 数据 编辑 的 操作 过 程 如 下 : 

1. 修改 数据 

找到 所 要 修改 的 数据 ,激活 〈 双 击 )， 然 后 修改 即 可 。 

2. 插入 或 删除 一 行 数 据 

1) 搬入 一 行 数据 

在 某 行 前 插入 一 新 行 。 操 作 方 法 是 首先 单 击 该 行 的 行头 ， 使 该 行 全 部 被 选中 ， 然 后 选 
择 “Edit>Insert Cases” 选 项 ， 或 单 击 工具 栏 的 “插入 行 Insert Cases” 图 标 ， 则 系统 自 
动 在 该 行 前 插入 一 个 新 行 。 














2) 删除 一 行 数据 

找到 
Edit>Clear 选项 ， 则 该 行 即 被 删除 。 
插入 或 删除 一 个 变量 ( 列 ) 

1) 插入 一 个 变量 ( 列 ) 

某 个 变量 ( 列 ) 前 插入 一 新 变量 ( 列 )。 
部 被 选中 ， 
Variable” 图 标 ， 则 系统 自动 在 该 列 前 插入 一 

2) 删除 一 个 变量 ( 列 ) 

找到 所 要 删除 的 列 ， 
“Edit>Clear” 选 项 ， 则 该 列 即 被 删除 。 


4.2.4 数据 文件 的 合并 


当 需 要 输入 的 数据 量 较 少时 ， 
数据 量 较 大 时 ， 


3. 





几 个 
分 别 存储 为 几 个 较 小 的 SPSS 数据 文件 。 ns 


SPSS 数据 文件 合并 到 一 起 
1. 横向 合并 数据 文件 


SS 
SS 


然后 选择 “Edit 一 Insert Variable” 
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所 要 删除 的 行 ， 单 击 该 行 的 行头 ， 使 该 行 全 部 被 选中 ， 然 后 按 Delete 键 ， 或 选择 


操作 方法 是 首先 单 击 该 列 的 列 头 ， 使 该 列 全 
选项 ,或 单 击 工具 栏 上 的 “插入 列 Insert 
个 新 变量 ( 列 )。 


单 击 该 列 的 列 头 ， 使 该 列 全 部 被 选中 ， 然 后 按 Delete 键 ， 或 选择 
,从 
RN 
可 以 由 一 个 人 站 和 编辑 器 中 输入 数据 ; 当 输入 的 
经 常 将 其 分 成 几 部 分 ， 由 输入 数据 。 这样 ， 一 份 完整 的 数据 被 
就 必须 将 这 几 个 较 小 的 


RN、 


横向 合并 数据 文件 就 是 将 三 去 份 数据 按 变 量 分 成 二 从 然后 分 别 输入 数据 并 存储 为 几 


个 较 小 的 SPSS 变量 数据 文件 ， 
合并 。SPSS 横向 合并 数据 文件 的 操作 过 程 如 下 
) 打开 第 二 让 数据 文件 。 下 

(2) 单 击 尺 
”对 锋 杠 。 有 两 个 如 下 选项 。 
© An open dataset: 


ables to… 




















后 将 这 几 个 变 


ta—> Merge Files 一 Add i ables. . 


从 当前 打开 的 数据 集 选 择 合并 文件 ， 列 表 框 中 显示 的 是 当前 打开 


人体 中 的 数据 左右 对 接 ， 进 行 横向 


”选项 ， 系 统 弹出 一 个 “Add Vari- 




















的 可 用 数据 集 名 称 。 
回 An External SPSS Statistics data file: 读 取 外 部 的 数据 文件 进行 合并 ， 该 项 需要 
户 指定 文件 路 径 和 文件 名 。 

目 户 根据 需要 选择 其 中 一 种 方式 打开 第 二 个 数据 文件 即 可 。 单 击 “Continue” 按 钮 ， 
系统 将 弹出 “Add Variables from. ..” (横向 合并 数据 文件 ) 对 话 框 ， 显 示 两 个 文件 所 含 
的 变量 信息 。 

左边 “Excluded Variables” 列 表 框 列 出 了 两 个 文件 中 的 同名 变量 ， 只 有 这 些 变量 可 


以 作为 关键 变量 。 右 边 “New Active Dataset” 


权时 
阶 
文件 中 的 变量 。 

横向 合并 数据 文件 窗口 的 选项 如 下 : 

@ 选中 “Match cases on key variables” 





有 [*] 的 变量 表示 第 一 个 数据 文件 中 的 变量 ， 附 有 [十 ] 的 变量 表示 被 合并 


列表 框 列 出 了 在 合并 后 新 的 文件 中 存在 的 


数据 





和 “Cases are sorted in order of key variables 
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in both datasets” 复 选 框 ， 并 从 “Exclude Variables” 列 表 框 中 选 出 作为 关键 变量 的 变量 
移 至 “Key Variables” 列 表 框 中 。 

@ 指定 提供 合并 数据 的 方式 。SPSS 有 3 种 数据 提供 方式 : Both files provide cases 是 
SPSS 系统 默认 的 方式 ， 指 合并 后 的 数据 由 原来 两 个 待 合 并 的 文件 数据 组 成 ; Non - active 
dataset is keyed table 指 保持 第 一 个 文件 的 数据 不 动 ， 将 第 二 个 文件 中 的 其 他 变量 合并 进 
来 ; Active dataset is keyed table 指 保持 第 二 个 文件 的 数据 不 动 ， 将 第 一 个 文件 中 的 其 他 
变量 合并 进来 。 

@ 选中 “Indicate case source as variable” 复 选 框 ， 表示 在 合并 后 的 数据 文件 中 创建 
一 个 新 变量 ， 用 来 区 分 合并 后 数据 文件 中 的 记录 来 自 合 并 前 的 哪个 文件 ， 为 0 时 表示 来 自 
第 一 个 数据 文件 ， 为 1 时 表示 来 自 被 合并 数据 文件 . “Indicate case source as variable” 复 
选 框 的 右 侧 有 一 个 文本 框 ， 用 来 输入 要 创建 的 那个 新 变 音 拘 名 称 ， 默认 名 称 为 

“source01”。 和 否则 ， 本 步 可 略 去 。 

(3) 单 直 ， OK” 按钮 ， 芭 可 完成 两 个 数据 文件 的 机 和 让 合并 结果 显示 在 数据 纺 
辑 窗 口 。 ,六 Ys 

这 里 需要 说 明 的 是 , 在 “Add Variable fon (和 神 向 合并 数据 文件 对话 框 的 下 方 
有 一 行 (5 个 ) 按钮 ， 分 别 是 “OK”*Paste” ”*“Cancel”“Help” 按 钮 ， 这 5 个 按 
钮 在 SPSS 的 统计 分 析 对 话 框 中 经 常 出 i 现 上 VD 它们 的 功能 介绍 如 下 : 

(1) 单 击 “OK” 按 钮 ， 表 示 所 有 操作 完成 后 ， 得 到 最 后 输出 结果 

(2) 单 击 “Paste” 按钮 , 表示 生 训 SPSS 语句。 | 

(3) 单 击 “Reset” 按 钮 表示 重新 选择 。 当 进行 完 品 工 组 数据 的 分 析 之 后 ， 要 单 击 
“Reset” 按 钮 ， 再 进行 下 二 组 数据 的 分 析 。 v 0 















































回 扩 党 回 《4 单 击 “Cancel” 按钮 表示 取消 操作 。 
上 ; C9) 单 击 “Help” 按 鲍 S 潜 示 操作 帮助 。 
画 私 NS 上 ”将 表 4 -1 中 的 数据 横向 合并 到 表 4 -2 中 。 
【条 展 视频】 表 4-1 某 单 位 职工 信息 表 (一 ) 
职工 号 (zgh) 学 历 (xl) 
1 1 
3 3 








5 2 


表 4-2 某 单 位 职工 信息 表 (二 ) 




















职工 号 (zgh) 性 别 (xb) 年 龄 (nl) 基本 工资 (sr) 职称 (ze) 
1 1 48 1014. 00 1 
2 19 984. 00 2 
3 54 1044. 00 1 
4 41 866. 00 4 
§ 1 38 848. 00 2 

















解 : 注意 此 例 中 的 关键 变量 是 “职工 
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号 ”", 表 4-1 中 2、4 号 职工 的 学 历数 据 空 白 ， 























合并 数据 时 按 系统 缺失 值 处 理 。 在 选中 “Indicate case source as variable” 复 选 框 后 ， 合 并 
后 的 数据 文件 中 创建 一 个 新 变量 “source01”, 合并 后 的 结果 如 表 4- 3 所 示 。 
表 4-3 横向 合并 数据 结果 
zgh xb nl sr ze XI source01 
1 1 48 1014. 00 1 1 1 
2 1 49 984. 00 2 0 
3 2 54 1044. 00 1 3 
4 2 41 866. 00 4 0 
5 于 38 848. 00 2 2 

















2. 纵向 合并 数据 文件 

纵向 合并 数据 文件 就 是 将 一 一 份 数据 按 观 测量 4 
几 个 较 小 的 SPSS 观测 量 数据 文件 ， 最 后 将 
行 纵向 合并 。SPSS 纵向 合 es 

(1) 打开 第 一 个 数据 文件 。 RR 

(2) 单 击 “Data>Merge ney Cses.. 
对 话 框 ， 有 如 下 两 个 选项 : 





Ar 


AS\ 


部 分 ， 然 后 分 别 输入 数据 并 存储 为 
测量 数据 文件 中 的 数据 上 下 对 接 ， 进 
如 下 : 


Me 


“Add Cases to...” 


be a 


D An open dateset hire 列表 框 中 显示 的 是 当前 打开 


的 可 用 数据 集 名 称 。 


@An External SPSS Statistics do “ 读 取 外 部 的 数据 文件 进行 


户 指定 文件 路 径 和 文件 名 。 

用 户 根据 需要 选择 其 中 一 种 方式 打开 第 二 个 
系统 将 弹出 “Add Case From...” 
量 信息 。 

左边 “Unpaired Variables” 列 表 框 列 出 
变量 的 含义 不 同 ， 且 不 放 入 合并 后 的 新 文件 中 。 妇 
变量 名 并 单 击 “Pair” 
合并 后 的 数据 文件 中 。 或 者 ， 
击 “Pair” 上 边 的 按钮 指定 某 变 量 不 经 任何 匹配 ， 
本 步 可 略 去 。 

右边 “Variables in New Active Dataset” 
种 默认 ， 可 单 击 
则 ， 本 步 可 略 去 。 

附 有 上 
文件 中 的 变量 。 


“Pair” 








1 





按钮 指定 配对 ,表示 它们 的 名 称 不 同 但 数据 含义 是 相同 的 ， 
对 某 变量 单 击 “Rename” 按 钮 改名 后 再 指定 配对 。 也 可 单 


列表 框 列 出 了 
默认 它们 具有 相同 的 数据 含义 ， 并 将 它们 作为 合并 
上 边 的 按钮 将 它们 剔除 到 


合并 ， 该 项 需要 用 


数据 文件 即 可 。 单 击 “Continue” 按 钮 ， 


(纵向 合并 数据 文件 ) 对 话 框 ， 显 示 两 个 文件 所 含 的 变 


了 两 个 文件 中 的 不 同名 变量 。SPSS 默认 这 些 


0 果 不 接受 这 种 默认 ， 可 选择 其 中 的 两 个 
可 进入 


强行 进入 合并 后 的 数据 文件 中 。 否 则 ， 
两 个 文件 中 的 同名 变量 ，SPSS 


后 新 数据 文件 中 的 变量 。 如 果 不 接 受 这 
列表 框 中 。 否 








“Unpaired Variables” 


Ph。 


的 变量 表示 第 一 个 数据 文件 中 的 变量 , 附 有 [十] 的 变量 表示 被 合并 数据 
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完成 上 述 操作 后 ， 将 左边 列表 框 中 的 不 同名 变量 选 和 到 右边 列表 框 中 。 
(3) 若 要 求 合并 后 的 数据 能 看 出 来 自 哪 个 数据 文件 ， 可 以 选中 “ 
复 选 框 ， 操 作 同 横向 合并 数据 文件 。 

“OK” 按 钮 ， 即 可 完成 两 个 数据 文件 的 纵向 合并 。 合 并 后 结果 显示 在 数据 


as variable” 





(4) 单 击 
编辑 窗口 中 。 


【 例 4. 2〗 将 表 4-4 中 的 数据 纵向 合并 到 表 4- 2 中。 


职工 号 (zgh) 


表 4-4 某 单位 职工 信息 表 (三 


性 别 (xb) 


“Indicate case source 





6 


2 





7 


1 





8 








2 AN RN 





表 4-5 wb, 


amt 合并 后 的 结果 如 表 4 -5 





























zgh xb i sr ze Source01 
NaNN | 
1 1 fs、 101 4. 00 eh 1 0 
TU < 
2 1 N,N 984.00. | 2 0 
严 1 
3 2 X 54 1033500~ 1 0 
sa ) 
4 A2 41 a 866. 00 1 0 
Vv 下 
pK } ~ .00 0 
5 AN 38 A 848. 0 2 
pp 
6 2 4 " 
7 1 3 1 
8 2 3 1 

















4.3 用 SPSS 进行 基本 统计 分 析 


4.3.1 数据 整理 


1. 数据 排序 


数据 排序 在 数据 分 析 过 程 中 有 很 重要 的 作用 。 它 便于 


最 大 和 最 小 值 ， 
程 如 下 : 


(1) 选择 “Data~~Sort Cases” 选 项 ， 
(2) 将 主 排序 变量 从 左面 的 列表 框 中 选 到 右 侧 的 “Sort by” 列 表 框 中 ， 








弹出 一 个 “Sort Cases” 对 话 框 。 


pb 





F 数 据 的 浏览 、 快 速 地 找到 数据 的 
同时 也 能 够 发 现 缺 失 值 的 数量 和 数据 的 异常 值 。SPSS 数据 排序 的 操作 过 


并 在 “Sort 
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Order” 选 项 中 选择 按 该 变量 是 升序 (Ascending) 还 是 降序 (Descending) 排序 。 

(3) Save Sorted Data: 将 分 类 的 数据 另存 为 一 个 文件 或 索引 。 当 左 侧 的 变量 被 选 人 
右 侧 的 列表 框 时 ， 激 活该 选 框 : 选中 “Save file with sorted data” 复 选 框 ， 激活“File” 
按钮 ， 单 击 它 即 可 指定 保存 文件 的 路 径 。 

(4) 单 击 “OK” 按 钮 ， 即 可 完成 数据 的 排序 。 排 序 结果 显示 在 数据 编辑 窗口 。 

【 例 4.3】 在 例 4. 1 中 , 将 表 4-2 中 的 数据 按 基 本 工资 (sr) 进行 升序 排列 。 

解 : 按 基本 工资 (sr) 进行 升序 排列 的 结果 如 表 4-6 所 示 。 


表 4-6 数据 排序 结果 

















zgh xb nl sr ze 
5 38 848. 和 党 2 
4 2 4 866; oS 4 





2 1 19 A NY 2 
NE 00 Y 


a 
< 
3 2 54 NA 1044. 00 1 




















2. 分 类 汇总 < 

分 类 汇总 是 按照 景 个 指定 的 变 和 进 i 分 类 汇总 计算 ,这 数据 处 理 方法 在 实际 数据 分 
析 中 经 常 使 用 。 例 如 ， 某 中 学 想 要 子 解 高 中 一 年 级 两 个 I 损 班 的 男 、 女 学 生 之 间 及 班级 之 
间 的 数学 考试 成 绩 是 否 在 在 较 天 差异 ， en 分 别 按 性 别 、 班 级 计 
算 其 平均 成 绩 ， 然 后 百 进 行 钱 较 。 分 类 汇总 的 基本 步骤 : @ 选 择 分 类 变量 ;四 选择 汇总 变 
其 ，@ 指 定 汇总 的 统计 其 。SPSS 分 类 汇总 前 操作 过 程 如 下 ， 

(1) 选择 N“Data~Aggregate. .. ”选项 ”弹出 一 个 “Aggregate Data” 对 话 框 。 

(2) 将 分 类 变量 选 到 “Break Variable(s)” 列 表 框 中 .将 汇总 变量 选 到 “Summaries 
of Variable(s)” 列 表 框 中 。 

(3) 单 击 “Name & Label,..” 按 钮 ， 重 新 指定 结果 文件 中 的 变量 名 及 其 标签 ， 指 定 
后 单 击 “Continue” 按 钮 ， 返回 “Aggregate Data” 对 话 框 。 若 不 指定 ， 默 认 的 变量 名 为 
原 变量 名 后 加 “ _1”。 

(4) 单 击 “Function... ”按钮 ， 弹 出 汇总 统计 量 对 话 框 ， 从 中 选择 需要 的 汇总 统计 
量 ， 选 择 后 单 击 “Continue” 按 钮 ， 返回 “Aggregate Data” 对 话 框 。 汇 总 统计 量 很 多 ， 
默认 的 是 计算 平均 数 。 最 常用 的 有 平均 数 〈Mean) 、 中 位 数 (Median) 、 和 数 (Sum) 、 标 
准 差 (Standard Deviation)、 最 小 值 (Minimum) 和 最 大 值 (Maximum) 等 。 

(5)“Number of cases” 复 选 框 是 将 分 组 数据 的 个 数 以 “N_BREAK” 为 默认 变量 名 
存 人 指定 的 结果 文件 中 ， 也 可 以 修改 变量 名 。 

(6) 单 选 按钮 Add aggregated variable to. .. : 定义 一 个 新 变量 ， 储存 分 类 汇总 的 结 
果 ; 单 选 按钮 Create a new dataset containing. .. : 创建 一 个 只 包含 汇总 结果 的 新 数据 文 
件 ; 单 选 按 钮 Write a new data file containing. .. : 分 类 汇总 的 结果 覆盖 当前 的 数据 文件 。 

(7) 单 击 “OK” 按 钮 ， 完 成 数据 的 分 类 汇总 。 汇 总 结果 显示 在 数据 编辑 窗口 。 
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【 例 4.4】 某 大 学 管理 学 院 工 商 管理 专业 一 年 级 两 个 班 共 有 学 生 3 
考试 成 绩 统计 如 表 4- 7 所 示 。 试 对 数学 考试 成 绩 分 性 别 、 班 级 计算 平均 数 。 


表 4-7 50 名 学 生 考 试 成 绩 
考试 成 绩 (X) 











班级 (bj) 性 别 (xb) 














男生 82, 62, 45, 89, 78, 90, 67, 78, 80, 76, 55, 77, 30 
1 

女生 | 77, 67, 98, 93, 81, 78, 73, 81, 69, 78, 99, 100 

男生 | 68, 89, 45, 65, 77, 84, 80, 79, 69, 81 


~ 





女生 67, 89, 99, 100, 69, 70, 72, 88, 90, 93, 82, 77, 67, 88, 99 








解 : 规定 :“1” 表 示 男 生 , “2” 表 示 女 生 。SPSS 数据 文件 中 涉及 的 变量 有 班级 、 性 
别 和 考试 成 绩 ， 其 中 班级 和 性 别 为 分 类 变量 ， 考 试 成 绩 为 汇总 变 最、 操作 过 程 按照 SPSS 
分 类 汇总 的 步骤 进行 其中， 在 “Number of cases” 复 选 框 9 将 分 组 数据 的 个 数 以 “ 数 
据 个 数 ” eh 在 “Create new dataset. .. ” 单 选 按钮 中 ， 将 
分 类 汇总 结果 以 “ 例 4. 4 分 类 汇总 结果 . sav” A 。 先 按 班级 再 按 性 别 进行 分 类 
汇总 的 结果 如 表 4 -8 所 示 ， 先 按 性 2 汇 总 的 结果 如 表 4-9 所 示 ， 



































表 4-8 50 名 学 生 考 分 类 汇总 结果 (一 ) 
序 号 bj mean 数据 个 数 
1 Lr Ce 1 69. 92 13 
2 3 2 12 
3 及 1 -Wl 上 10 
4 > 入 )2 阳 15 
ES 下 
NAN， 表 4-9 50 名 学 生 考试 成 绩 分 类 汇总 结果 (二 ) 
序 号 《 xb bj mean 数据 个 数 
1 1 1 69. 92 13 
2 1 2 73.70 10 
3 2 1 82. 83 12 
4 2 2 83. 33 15 














2. 数据 变换 

数据 变换 是 在 原 有 变量 数据 的 基础 上 ， 计 算 产 生 一 些 含有 更 丰富 信息 的 新 数据 。 例 
如 ,根据 学 生 的 某 门 课程 的 平时 成 绩 、 期 中 考试 成 绩 和 期 末 考 试 成 绩 计 算 总 成 绩 ， 根据 教 
师 的 教学 工作 量 和 科研 工作 量 计 算 年 末 总 工作 量 ， 等 等 。SPSS 数据 变换 的 操作 过 程 如 下 : 

(1) 选择 “Transform 一 Compute Variable...” 选 项， 弹出 “Compute Variable” 对 
话 框 。 

(2) 在 “Target Variable” 文 本 框 中 输入 存放 计算 结果 的 新 变量 名 。 新 变量 的 变量 类 
型 默认 为 数值 型 ,使 用 者 可 以 根据 需要 单 击 “Type&-Label. .. ”按钮 进行 修改 ， 还 可 以 对 
新 变量 加 变量 标签 。 
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(3) 在 “Numeric Expression” 文 本 框 输入 或 选择 表达 式 值 (注意 : 表达 式 中 的 变量 


必须 从 左 侧 列表 框 中 选 人 ) 。 


(4)“Function group” 项 列 出 了 系统 预 装 的 函数 。 
(5) 单 击 “if... ”按钮 打开 条 件 表达 式 对 话 框 ,选择 符合 条 件 的 个 案 进 行 变量 计算 。 





其 中 ,“Include all cases” 选 项 是 指 包 括 所 有 观测 值 ,“Include if cases satisfies condition” 


选项 是 指 包 括 符号 条 件 的 观测 值 。 选 择 后 单 击 “Continue” 按 钮 ， 返回 到 “Compute Variables” 
对 话 框 。 此 步 可 以 省 略 。SPSS 系统 默认 的 是 “Include all cases” 选 项 。 

(6) 单 击 “OK” 按 钮 ， 即 可 完成 数据 的 变换 。 变 换 结果 显示 在 数据 编辑 窗口 。 

【 例 4. 5】 10 名 学 生 的 语文 和 数学 期 末 考 试 成 绩 如 表 4 - 10 所 示 ， 按 这 两 门 课 总 成 绩 


的 50% 计 算 总 成 绩 。 


表 4-10 10 名 学 生 两 门 课 期 未 考试 成 绩 纶 
学 生 序号 (xh) 数学 (Xi) 语文 (Xs) 





68 


Ne 


56 






































/ 站 
解 : 用 X 表示 变换 后 的 总 成 绩 ， 则 X 一 (Xi 十 Xz)* 0.5。 按 照 SPSS 变量 变换 的 操作 
步骤 ,得 出 以 下 变换 结果 ,如 表 4 一 11 所 示 。 


表 4-11 10 名 学 生 两 门 课 期 末 考 试 成 绩 的 变换 结果 



































xh Xi X; 玉 

1 68 56 62.00 
a 75 76 75. 50 
3 87 81 84. 00 
1 92 63 77. 50 
5 61 90 75. 50 
6 76 72 74. 00 
7 58 85 71. 50 
8 90 94 92. 00 
9 89 69 79. 00 
10 77 70 73. 50 
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4.3.2 数据 分 组 


数据 分 组 就 是 根据 统计 研究 的 需要 ， 将 数据 按 某 种 标准 重新 划分 为 不 同 的 组 别 。 
SPSS 软件 提供 了 单项 式 分 组 和 组 距 式 分 组 两 种 方法 。 

1. 单项 式 分 组 

单项 式 分 组 首先 将 全 部 变量 值 按 分 组 变量 值 排序 ， 分 组 结果 为 数据 排序 后 的 名 次 ， 存 
放 在 一 个 新 的 变量 中 。 该 变量 的 变量 值 标签 是 分 组 变量 的 变量 值 。 具 有 相同 变量 值 的 数据 
被 分 在 一 组 中 。SPSS 单项 式 分 组 的 操作 过 程 如 下 : 

(1) 选择 “Transform>Automatic Recode. .. ”选项 ， 弹 出 “Automatic Recode” 对 
话 框 。 Re 
(2) 将 对 话 框 左 侧 列表 框 的 分 组 变量 选择 到 右 侧 的 / Ce le 一 New Name” 列 表 





框 中 。 








(3) 在 “New Name” enim it ene toe 结果 的 新 变量 名 ， 并 单 击 
“Add New Name” 按 钮 。 

(4) 在 “Recode Starting {rom” pri E 按 升序 (Lowest value) 进 
行 还 是 按 降 序 (Highest value) 进行 位 

(5) 单 击 “OK” 按 钮 ， i ve 数据 输出 窗口 和 数据 
编辑 窗口 。 » 

【 例 4.6】 使 用 有 SPSS 人 和弦; 生生 志 1 中 的 数据 进行 分 组 。 

解 : 站 下 全 和 ;数据 厅 离散 型 变量 ， 因 祯 用 单项 式 分 组 方法 。 本 例 分 组 变量 (X) 
值 为 2、3、4、 5 人 和 有 次 分 别 为 1、2 TEL、 瑟 ， 并 存放 在 新 变量 (Xi) 中 。 按照 SPSS 
单项 式 分 组 操 、 在 数据 输出 窗口 得 到 家 4- 12， 将 数据 编辑 窗口 中 的 输出 结果 加 以 
整理 得 到 表 4 -13。 























表 4-12 单项 式 数据 分 组 输出 结果 (一 ) 
X inte Xi (机 床 台 数 ) 
Old Value New Value Value Label 
到 1 2 
3 2 3 
4 3 4 
5 4 5 
6 5 6 











在 表 4 一 12 中 ,“Old Value” 表 示 分 组 变量 X 的 值 ; “New Value” 表 示 将 分 组 变量 
(X) 的 值 排序 后 的 名 次 ， 存放 在 新 变量 (Xi ) 中 ; “Value Label” 表 示 新 变量 (Xi ) 的 
标签 值 ， 它 是 分 组 变量 (X) 的 值 。 
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表 4-13 单项 式 数据 分 组 输出 结果 (二 ) 
| | | 
1 3 2 11 4 3 21 2 L 31 3 2 41 2 i 
2 6 5 12 2 22 2 2 32 5 4 42 6 5 
3 2 和 13 5 4 23 6 5 33 4 入 43 3 2 
4 4 3 14 2 是 24 5 4 34 5 4 44 4 3 
5 3 2 15 6 5 25 4 3 35 6 5 45 5 4 
6 i 16 2 1 26 1 36 2 | 46 4 3 
a 6 5 17 3 2 27 4 呈 37 2 47 5 4 
8 4 3 18 5 4 28 3 2 38 6 六 5 48 2 和 
9 3 2 19 4 3 29 2 1 39 4 Fe 49 3 2 
10 L 20 3 2 30 40 2 50 5 4 

































































在 表 4-13 中 , 第 1 列 为 工人 序号 (grh)， 第 2 列 :* 人 看 管 的 机 器 台数 (X), 第 3 
列 为 将 分 组 变量 (X) 的 值 排序 后 的 名 次 人 ， 在 第 3 列 中 ， 对 应 于 1 号 工人 的 


(X1) 的 值 是 2， 本 2 组 中 。 


2. 组 距 式 分 组 NF- 

组 距 式 分 组 是 将 全 部 变量 全 依次 划分 为 若 二 个 区 间 半 将 这 一 区 间 的 变量 值 作为 一 
组 。 下 面 重 点 介绍 SPSS 等 距 分 组 的 操作 过 程 。 ，X 一 以 

(1) 首先 将 原始 资料 按 并 序 进行 排列 并 计算 极 sk 其 次 由 斯 特 吉 斯 经 验 公式 确定 组 
数 和 组 距 ， 即 组 数 & 志 1+8. 3221gN， 组 距 4 一 RX&y 最 后 确定 组 限 。 取 第 一 组 下 限 略 高 于 
最 小 变量 值 ， 则 该 组 征 限 一 该 组 下 限 十 组 随 学 

(2) 选择 SN nsform-> Visual Binnifl>.. ”选项 ， 弹 出 “Visual Binning” 对 话 框 。 
将 对 话 框 左 侧 列表 框 中 需要 分 组 的 变量 选 入 到 右 侧 的 “Variables to Bin” 列 表 框 中 ， 对 话 
框 底部 有 一 个 “Limit number of cases scanned to” 复 选 框 ， 其 作用 是 当 数 据 量 很 大 时 ， 需 
要 设 定 参与 分 析 的 记录 数目 ， 以 避免 分 析 时 间 过 长 ; 若 数据 量 不 是 很 大 ， 该 选项 可 忽略 。 
单 击 “Continue” 按 钮 ， 弹 出 一 个 新 的 “Visual Binning” 对 话 框 。 

(3) 新 的 “Visual Binning” 对 话 框 设置 如 下 : 

@ 左上 侧 的 “Scanned Variable List” 列 表 框 : 列表 框 中 的 变量 正 是 刚才 选择 的 变量 ， 
单 击 该 变量 ， 则 右 侧 的 很 多 文本 框 被 激活 。 

@ 左下 侧 的 “Cases Scanned” 灰 色 文 本 框 是 对 应 变量 参与 分 析 的 记录 数 ， “Missing 
Values” 灰 色 文 本 框 是 对 应 变量 参与 分 析 时 的 缺失 记录 数 。 

@ 右上 侧 的 “Current Variable” 文 本 框 显 示 的 是 当前 变量 , “Binned Variable” 文 本 
框 输入 分 组 变量 名 及 标签 ,“Minimum” 灰 色 文本 框 为 变量 的 最 小 值 , “Maximum” 灰 色 
文本 框 为 变量 的 最 大 值 。 

图 右 下 侧 的 “Upper Endpoints” 选 项 组 包含 2 个 单 选 按钮 ， 其中, “Include(< 一 )” 
单 选 按钮 表示 确定 的 一 组 的 上 限 值 包含 在 该 组 内 ， 而 “Exclude( 近 )” 单 选 按钮 表示 确定 
的 一 组 上 限 值 包含 在 下 一 组 内 。 
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单 击 “Make Cutpoints. .. ”选项 ， 弹 出 一 个 “Make Cutpoints” 对 话 框 , 包括 3 个 
Location 划分 方法 选项 ,第 一 个 是 Equal Width Intervals 等 间距 划分 框 ， 在 内 部 首先 在 
“First Cutpoint Location” 文 本 框 中 输入 第 一 组 的 上 限 ， 然 后 在 “Width” 文 本 框 中 输入 
组 距 ， 这 时 将 鼠标 移动 到 “Number of Cutpoints” 文 本 框 中 ,系统 自动 计算 出 断 点 数目 





(组 数 一 断 点 


数 十 1)。 单 击 “Apply” 按 钮 返回 到 新 的 “Visual Binning” 对 话 框 。 


中 下 侧 存放 一 个 Grid 表格 ,显示 的 是 分 组 的 上 、 下 限 ,， 单 击 “Make Labels” 按 
钮 ， 表 格 里 面 的 Label 栏 显 示 分 组 的 提示 。 

(4) 单 击 “OK” 按 钮 ， 完 成 后 首先 出 现 一 个 信息 提示 对 话 框 ， 说 明 创建 新 变量 的 情 
况 。 关闭 该 对 话 框 后 ， 在 数据 编辑 器 窗口 显示 变量 分 组 结果 。 

【 例 4.7】 SPSS 的 组 距 式 数据 分 组 功能 对 例 2. 2 中 的 数据 进行 分 组 。 








回 剖 多 加 





EE 
【拓展 视频 】 




















解 : 由 于 工资 属于 连续 型 变量 ， 因 此 采用 组 距 式 分 组 访 法 

(1) 用 SPSS a nll 
2100，2200，2340，2470，2540，2590。x2800Y 2740，2790，2850 
2980，3000，3040，3130，3210， wold, 3280，3300，3320 


3320，3350，3390，3400，3400，3500,35 5003 js560, 3680，3700 
3780，3800，3840，3890，3900， ye 4660，4080，4100，4120 
4200，4300，4320，4400，4450 SN- 4580，4640，4780，4800 


(2) 计算 极 差 RR。 ,> 区 


R- 温 类 什 一 最 小 值 = tomo 2700 


(3) 确定 组 数 和 组 内 _ SS > 


组 数 


组 距 


因此 ， 


由 斯 特 二 斯 经 驹 人 趟 了 


入 NV 
& 一 1 十 3. 3221gN 一 1 十 3. 3221lg50 一 1 十 3. 322X1. 699sz6. 644=z7 


d=R/k=2700/7T385.7 


区 整数 组 距 4 一 400， 并 进行 等 距 分 组 。 


(4) 确定 第 一 组 上 限 。 
取 第 一 组 下 限 为 2050， 则 该 组 














上 限 = 下 限 十 组 距 一 2050 十 400 一 2450 


(5) 分 组 输出 结果 ， 如 表 4 一 14 所 示 。 
在 表 4-14 中 , 第 1 列 为 教师 序号 (xh)， 第 2 列 为 教师 工资 (X)， 第 3 列 为 将 分 组 
变量 (X) 的 值 分 组 排序 后 的 名 次 (Xi)， 即 7 个 组 按 从 小 到 大 的 顺序 排列 为 1、2、3、4、 


5、6、7。 例 











如 , 在 第 3 列 中 ， 对 应 于 1 号 教师 的 Xi 的 值 是 1， 表示 他 的 工资 2200 元 应 分 


到 第 1 组 中 。 
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表 4-14 组 距 式 数 据 分 组 































































































xh x xX xh 天 x xh 5 xX xh 芝 x 
9 2200 各 16 3680 5 31 3840 5 46 2340 
2 2100 1 17 4500 坚 32 3400 4 47 3900 5 
3 4640 | 18 3210 3 33 4100 6 48 4450 人 
4 4580 7 19 3400 4 34 3350 4 49 2790 2 
5 3500 4 20 3320 4 35 4780 治 50 3280 4 
6 4080 6 21 | 4200 6 36 | 2600 3 

7 2980 3 22 | 3780 5 37 | 4320 6 

8 4000 5 23 | 3980 5 38 | 3130 3 

9 3560 4 24 | 3800 5 39 | 4300 6 

10 | 2850 3 25 | 4800 这 40 | 3890 | oh 

11 3320 4 26 | 3210 3 41 2 

12 | 2470 2 27 | 2590 作 42 | 3300 | 1 4 

13 3000 3 28 4400 6 43/ Ra 0 4 

14 2540 2 29 3700 5 NE 4 

15 3040 3 30 | 2740 45 4120 6 





4.3.3 计算 基本 描述 统计 量 Ne 


TU Xs 

在 统计 研究 中 ， 我 们 经 党 对 标准 化 后 的 数据 次 有 行 统计 分 析 ， 其 目的 是 将 不 同 的 指 

标 综合 加 总 ， 从 而 排除 同 量 4 的 影响 。 。 了 江 计 算 描 述 统计 量 的 功能 ， 它 可 以 将 

原始 数据 资料 转换 成 标准 2 的 数据 编辑 窗口 中 ， 以 供 进一步 分 析 。 将 
| 


原 数据 变量 ei Z_X 的 公式 为 
入 x—X 
4 二 


X= (4-1) 


式 中 ，X 表示 原 变 量 的 平均 数 ，S 表示 原 变量 的 标准 差 。 

常用 的 描述 统计 量 有 平均 数 、 和 数 、 标 准 差 、 方 差 、 最 大 值 、 最 小 值 、 极 差 、 平 均 数 
标准 误差 、 偏 度 和 峰 度 等 。SPSS 计算 基本 描述 统计 量 过程 如 下 : 

(1) 选择 “Analyze 王 Descriptive Statistics 一 Descriptives... ”选项 ， 弹 出 一 个 “De- 
scriptives” 对 话 框 。 

(2) 从 左 侧 列表 框 选 出 需 计 算 的 变量 放 到 右 侧 “Variable(s)” 列 表 框 中 。 

(3) 若 需 要 标准 化 变量 ， 则 选中 “Save standardized values as variables” 复 选 框 ， 然 
后 单 击 “OK” 按 钮 ， 返回 数 据 编辑 窗口 ， 则 标准 化 后 的 变量 显示 在 数据 编辑 窗口 中 ， 接 
下 来 可 以 选择 该 标准 化 变量 进行 描述 性 分 析 。 和 否则 ， 不 做 选择 。 

(4) 单 击 “Options... ”按钮 ， 弹 出 “Descriptives: Options” 对 话 框 . 指定 计算 哪些 统 

















计量 。 
@ Mean 复 选 框 : 平均 数 。 

@@ Sum 复 选 框 ， 和 数 。 

@ Dispersion 选项 组 :描述 离散 程度 的 统计 量 ， 包 含 6 个 复 选 框 。 
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。 Std. deviation 复 选 框 : 标准 差 。 
.Variance 复 选 框 : 方差 。 

c，Range 复 选 框 : 极 差 。 

d，Minimum 复 选 框 : 最 小 值 。 

e. Maximum 复 选 框 : 最 大 值 。 

f，S. E. mean 复 选 框 : 平均 数 标准 误差 ， 指 样本 平均 数 作为 抽样 样本 的 平均 数 与 总 体 
平均 数 的 平均 差异 ， 即 


本 全 


S.E. Mean 一 二 (4-2) 
A 


n 
@ Distribution 选项 组 : 检验 分 布 形态 的 统计 量 ， 包含 2 个 复 选 框 。 
a. Kurtosis 复 选 框 : 偏 度 及 其 标准 误差 。 
b.，Skewness 复 选 框 : 峰 度 及 其 标准 误差 。 ,从 
@@ Display Order 项 : 计算 结果 输出 顺序 。 包 含 4 个 
a Variable list: 按 “Variable” ee 
b. Alphabetic: 按 各 变量 的 字母 排列 顺序 输 ! < 
c，Ascending means; rp hi 
d. Descending means: 过 输出 。 
@ 单 击 “Continue” 按 钮 ， 返 ee 对 话 框 。 
(5) 单 击 “OK” 按 钮 ， 吉 果 显示 在 数据 输出 窗口 。 
【 例 4.8】 从 某 中 学 seat 14 名 学 生 ， 人 
所 示 ， 试 计算 以 下 两 个 问 
(1) 语文 考试 成 绩 的 3 本 描述 统计 量 。 本 
《2 ST 大 考 了 大 绩 的 平均 数 和 标 人 





















































表 4-15 学 生 四 门 课程 测验 成 绩 (单位 ， 分 》 
语文 数 学 物理 生 物 
61 85 78 62 65 
77 74 73 69 60 
75 ?9 68 74 64 
74 71 81 86 75 
78 74 69 Ci 57 
68 47 87 68 75 
65 60 74 69 69 
74 68 65 66 63 
58 74 75 63 74 
62 76 59 57 57 
70 74 62 82 55 
76 77 69 82 73 
72 77 87 75 ?1 
70 87 57 68 71 
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解 : (1) 根据 SPSS 计算 基本 描述 统计 量 操作 步骤 ,将 输出 结果 整理 后 如 表 4 -16 
所 示 。 
表 4-16 语文 考试 成 绩 的 基本 描述 统计 量 结果 
N Range Minimum Maximum Sum Mean 

Statistics Statistics Statistics Statistics Statistics Statistics Std. Error 
语 14 20 58 78 980 70 1.703 
文 Std. Variance Skewness Kurtosis 

Statistics Statistics Statistics Std. Error Statistics Std. Error 

6.373 40.615 一 .614 .597 一 .801 1. 154 





























时 差 是 1. 703 分 ; 标准 差 为 


由 表 4-16 可 以 看 出 ，14 0 Fe 58 分 ， 最 高 为 


6. 373 分 ,方差 为 40. 615; 偏 度 为 一 0. 614 一 0， 呈 左 
绩 较 高 的 占 少数 ， 峰 度 为 一 0. 801 二 0， 呈 平 峰 分 布 < 说 明成 绩 的 分 丰 
一 些 平 峰 。Std, Error 是 偏 度 和 峰 度 的 平均 妆 棋 准 = 
(2) 输出 结果 如 表 4-17 所 示 。 .AN 
表 4 - 17 ` 五 门 刘 程 考试 的 平均 成 绩 及 标准 关 


78 分 ; 总 成 绩 为 980 分 ， 平 均 成 绩 为 70 分 ， 





if， 说 明成 绩 较 低 的 占 多 数 ， 成 
6 与 正 态 分 布 相 比 略 有 




















Vr 
ED A We Std，Deviation 
语文 rN Mo, 00 6.373 
7 
数学 yp. a 14 » 73.07 9. 980 
AN -一 
物理 、， 14 夭 Xs i 9. 433 
J 
化 学 4 14 71.29 8. 407 
生物 14 66. 36 T1158 








由 表 4-17 可 以 看 出 ，14 名 学 生 的 数学 平均 成 绩 最 高 ,但 其 标准 差 也 最 大 ,说 明 学 生 


的 成 绩 差异 比较 大 ; 生物 平均 成 绩 最 低 ， 但 其 标准 差 较 小 ， 说 明 学 4 
4.3.4 频数 分 析 





SPSS 中 的 频数 分 析 功 能 不 仅 可 以 产生 详细 的 频数 分 布 表 ， 还 可 





E 的 成 绩 


差异 比较 小 。 


[以 按 要 求 计 算出 基本 


描述 统计 量 。 另 外 ， 它 还 可 以 通过 分 析 作出 统计 图 。SPSS 频数 分 析 的 操作 过 程 如 下 : 
(1) 选择 “Analyze> Descriptive Statistics 一 Frequencies. .. ”选项 ， 弹 出 “Frequencies” 


对 话 框 。 


(2) 从 左 侧 列表 框 中 将 需要 进行 频数 分 析 的 变量 选择 到 右 侧 的 “Variable(s)” 列 表 框 中 。 
(3) 选中 “Display frequency tables” 复 选 框 。 要求 输 出 频数 分 布 表 。 如 不 需要 可 以 


忽略 。 


(4) 单 击 “Statistics. . . ”按钮 ， 弹 出 “Frequencies: Statistics” 对 话 框 。 在 该 对 话 


框 可 以 进行 输出 基本 描述 统计 量 的 设置 ,各 选项 含义 如 下 : 
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@ Percentile Values 选项 组 : 指定 百 分 位 数 ， 包括 3 个 复 选 框 。 
a，Quartiles 复 选 框 : 输出 25%、50%、75% 的 百 分 位 数 。 
b.Cut points for. . .equal group 复 选 框 : 输入 2 一 100 的 整数 ， 若 输入 4， 则 用 百 分 位 

















数 将 数据 4 等 分 输出 25%、50%、75% 的 百 分 位 数 。 


c。，Percentile(s) 复 选 框 : 输入 0 一 100 的 数 ， 若 输入 2. 5， 则 输出 2. 5% 的 百 分 位 数 ， 


然后 单 击 “Add” 按 钮 。 


@ Central Tendency 选项 组 : 指定 集中 趋势 统计 量 ， 包括 4 个 复 选 框 。 
a. Mean 复 选 框 : 平均 数 。 
b. Median 复 选 框 : 中 位 数 。 
c，Mode 复 选 框 : 众 数 。 
d，Sum 复 选 框 ， 和 数 。 4 
回 Dispersion 选项 组 : 指定 离散 程度 统计 量 ， 包括 6 人 复生 从 
a，Std. deviation 复 选 框 : 标准 差 。 忌 
b. Variance 复 选 框 : 方差 。 2 
c，Range 复 选 框 : 极 差 。 NT- 
d，Minimum 复 选 框 ， 最 小 值 。 有 六 
e。Maximum 复 选 桓 ， 最 大 值 。 /下 

AN 
f S. E. mean 复 选 框 : 平均 数 标准 误 闪 
@ Distribution 项 指定 分 布 形 埠 统计 量 ， 包 括 2 个 复 泛 框 。 
a，Skewness 复 选 框 : 偏 1 \ ,NO WX 
b. Kurtosis 复 选 框 3 蜂 度 。 ,WY 本 
© Values are group idpoints 复 选 Ee 数据 分 组 后 选中 该 项 ， 在 计算 百 分 位 数 和 中 


位 数 时 ， 用 各 组 的 组 叫 值 代表 各 组 数据 ,入 


@ 单 击 Continue” 按钮 ， 返回 到 “Frequencies” 对 话 框 。 
(5) 单 击 “Charts. ..” 按钮 ， 弹 出 “Frequencies: Charts” 对 话 框 。 在 该 对 话 框 可 以 


进行 输出 统计 图 的 设 兽 ,各 选项 含义 如 下 。 


框 ， 


Q@ Chart Type 选项 组 : 用 于 有 关 图 形 输 出 类 型 的 选择 ， 包 括 4 个 单 选 按钮 。 

a，None 单 选 按钮 : 不 输出 任何 图 形 ， 是 系统 默认 的 方式 。 

b，Bar charts 单 选 按钮 : 条 形 图 。 

c，Pie charts 单 选 按钮 : 饼 图 。 

d，Histograms 单 选 按钮 : 直方 图 。 若 选中 “Show normal curve on histogram” 复 选 
则 图 中 带 有 正 态 曲 线 。 

@ Chart Values 选项 组 : 用 于 图 形 坐 标 含义 的 设置 ， 包 括 2 个 单 选 按钮 。 
a，Frequencies 单 选 按钮 : 纵 坐标 表示 频数 。 

b. Percentages 单 选 按钮 : 纵 坐 标 表示 百分比 。 

图 单 击 “Continue” 按 钮 ， 返回 到 “Frequencies” 对 话 框 。 

(6) 单 击 “Format... ”按钮 ， 弹 出 “Frequencies: Format” 对 话 框 。 在 该 对 话 框 可 





以 设置 有 关 输 出 的 格式 ,各 选项 含义 如 下 : 


@ Order by 选项 组 : 用 于 设置 频数 表 中 变量 的 排列 顺序 ， 包括 4 个 单 选 按钮 。 
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a. Ascending values 单 选 按钮 :数据 按 升序 排列 。 

b，Descending values 单 选 按钮 : 数据 按 降序 排列 。 

c，Ascending counts 单 选 按钮 : 频数 按 升序 排列 。 

d. Descending counts 单 选 按钮 : 频数 按 降序 排列 。 

@ Multiple Variables 选项 组 : 用 于 设置 多 变量 项 频数 输出 形式 ,包括 2 个 单 选 按钮 。 

a Compare variables 单 选 按钮 : 将 变量 的 结果 显示 在 同一 表 或 图 形 中 ， 是 系统 默认 
的 方式 。 

b，Organize output by variables 单 选 按钮 : 将 变量 的 结果 显示 在 不 同 的 表 或 图 形 中 。 

@ Suppress tables with many categories 复 选 框 : 用 于 设置 频数 表 的 输出 范围 。 当 频 
数 分 布 表 的 分 组 数 大 于 框 中 输入 的 值 时 ， 按 该 值 表示 的 组 数 显示 。 

@ 单 击 “Continue” 按 钮 ， 返 回 到 “Frequencies” 对 话 框 。 

(7) 单 击 “OK” 按 钮 ， nen 
窗口 。 

【 例 4.9】 对 例 2. 1 中 的 数据 进行 频数 分 析 。 SS 

解 : (1) 输出 统计 表 结 果 ， 如 表 4-18 示 〈 不 用 对 数据 进行 单项 式 分 组 ， 
直接 对 原 变 主 进行 频数 分 析 ) 。 























表 4~18 六 nn 








™ wh SS 党 FF 
























































Mean 3. 66 
Std. Error of Mean 二 ~ . RR r .199 
: > ES 和 
Median r WS 六 3.50 
»] 
Mode / 
Std，Deviation 1. 409 
Variance 1. 984 
Skewness .320 
Std. Error of Skewness .337 
Kurtosis 一 1.176 
Std，Error of Kurtosis .662 
Range 4 
Minimum 2 
Maximum 6 
Sum 183 
2.5 2.00 
25 2.00 
Percentiles 
50 3.50 
75 5.00 
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表 4 一 18 结果 解释 : 第 1 行 (Valid) 为 有 效 样 本 数 ; 第 2 行 (Missing) 为 没有 缺失 
值 ; 第 3 一 14 行 为 基本 描述 统计 量 ; 最 后 4 行 (Percentiles) 为 从 上 至 下 依次 是 2. 5%、 
25%、50% 和 75% 的 百 分 位 数 的 数值 。 


表 4-19 频数 分 布 表 




















Frequency Percent Valid Percent Cumulative Percent 
2 14 28.0 28.0 28.0 
3 11 22.0 22.0 50.0 
4 10 20.0 20.0 70.0 
Valid 
5 8 16.0 16.0 86.0 
6 村 14.0 14.07 100.0 
Total 50 100.0 AOG. 入 




















表 4-19 结果 解释 : 第 1 列 (Valid) 为 有 站 2 列 为 分 组 变量 取 值 ; 第 3 


列 (Frequency) 为 频数 ;第 4 列 (Percent) 为 原始 (频率 )， 即 含有 缺失 值 的 百 
分 比 ; 第 5 列 (Valid Percent) 为 有 效 的 百分比 >( 源 庚 )， 即 不 含有 缺失 值 的 百分比 ; 第 6 
列 (Cumulative Percent) 为 向 上 累积 的 有 A (频率 ) 。 

由 表 4- 19 得 到 的 分 析 结 论 如 下 


Kk 
本 次 调查 的 总 工人 数 是 50 AN 看 管 2 一 6 ee a TL. To 








8、7 人 ， 占 总 人 数 的 28%、22 和 X20%、16%、14% ,每 管 少 于 4 台 机 器 的 工人 数 达到 
50%。 由 于 在 机 器 台数 这 个 变量 征 ， 无 缺失 值 ， 因 此 家 分 化 和 有 效 百分比 相同 。 

(2) 输出 统计 图 结果 如 图 4. 1 一 4. 3 所 示 %SPSS 频数 分 析 功能 只 提供 了 简单 的 输出 
图 形 ， 若 想 使 图 形 划 加 美观 、 显 示 的 内 容 更 加 让 褒 。 还 可 以 根据 需要 对 阅 形 进行 编 加 。 在 
i (Graphs) 功能 ”这 部 分 内 容 后 面 会 详细 介绍 。 

‘ 机 
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Histogram 














床 台 至 
图 4.2 饼 图 KC 图 4.3 直方 图 


本 例 中 的 条 形 图 、 饼 图 和 直方 图 均 使 as 条 形 图 清楚 地 显示 出 看 管 2 
台 机 器 的 工人 数 最 多 ， hg Wo 饼 图 虽然 通过 扇形 面积 的 大 小 也 能 反 
映 出 分 类 结果 ， 但 就 本 例 而 计 Se 
二 者 对 比分 析 发 现 ， WE 

实际 研究 中 ， TA BR 
问题 而 定 。 


























[ 例 4.10] 对 后 -2 中 的 数据 进行 师 庆 从 入 回 赵 % 回 
a 组 虐 式 数据 分 组 功能 进行 分 组 的 基础 上 ， 对 分 组 变量 总 二 
进行 频数 分 析 将 到 频数 分 布 表 4 - 20 和 直方 图 4. 4。 癌 
表 4-20 频数 分 布 表 【拓展 视频 】 
Frequency Percent Cumulative Percent 
=2450 3 6.0 6.0 6.0 
2450 一 2849 6 12.0 i120 18.0 
2850 一 3249 党 14.0 14.0 32.0 
3250~3649 12 24.0 24.0 56.0 
Valid 
3650 一 4049 9 18.0 18.0 74.0 
4050 一 4449 7 14.0 14.0 88.0 
4450 十 6 12.0 12.0 100.0 
Total 50 100.0 100.0 




















由 表 4 一 20 得 到 的 分 析 结 论 如 下 : 
本 次 调查 的 总 教师 人 数 是 50 人， 其中， 工资 在 3250 一 3649 元 的 人 数 最 多 ， 占 总 人 数 
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的 24%， 而 工资 低 于 2450 元 的 人 数 最 少 ， 只 占 总 人 数 的 6% 。 由 于 在 教师 工资 这 个 变量 
中 ,无 缺失 值 ， 因 此 百分比 和 有 效 百分比 相同 。 
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Mean=4.26 
Std.Dev.=1.724 
N=50 


0 2 4 


EY 
Ne 


直方 图 
由 图 4.4 可 见 ， 人 效果 较 好 ， A 
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和 


a 





RE cp 

SPSS 制图 功能 强 ， 能 给 制 许多 种 统 旋风 拉 ， 这 些 图 形 可 以 由 各 种 统计 分 析 过 和 产生， 
也 可 以 直接 从 Graphs 图 形 菜单 中 的 一 系列 图 形 选项 直接 产生 。 下 面 重点 介绍 统计 分 析 中 
常用 的 条 形 图 、 饼 图 、 直 方 图 、 线 形 图 和 散 点 图 的 绘制 。 


4.4.1 统计 图 的 绘制 


1. 条 形 图 


条 形 图 (Bar) 常用 于 表示 单个 变量 的 变化 趋势 或 多 个 变量 之 间 的 比较 。 

条 形 图 共有 3 种 图 示 类 型 ， 分 别 是 简单 条 形 图 (Simple)、 分 组 条 形 图 (Clustered) 
和 分 段 条 形 图 (Stacked)。 其 中 ， 简 单条 形 图 是 以 若干 平行 且 等 宽 的 矩形 表现 数量 对 比 关 
系 ， 条 间 有 间隙 ， 分 组 条 形 图 是 由 两 条 或 两 个 条 组 成 一 组 的 条 形 图 ; 分 段 条 形 图 是 以 条 形 
的 全 长 代表 某 个 变量 的 整体 ， 条 内 的 各 分 段 长 短 代 表 各 组 成 部 分 在 整体 中 所 占 比 例 ， 每 一 
段 用 不 同 线条 或 颜色 表示 。 

条 形 图 绘制 采用 的 统计 量 描述 模式 ， 也 可 分 为 3 种 类 型 ， 即 观测 量 分 类 描述 模式 
(Summaries for groups of cases) 、 变 量 描述 模式 (Summaries of separate variables) 和 观 
测 值 模式 (Values of individual cases)。 其 中 ,观测 量 分 类 描述 模式 对 应 分 类 轴 变 量 中 的 
每 一 种 类 观测 量 生成 一 个 简单 〈 分 组 或 分 段 ) 图 形 ; 变量 描述 模式 对 应 每 个 变量 生成 一 个 
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图 形 ， 即 一 个 条 或 一 个 折 点 代表 一 个 变量 ， 这 种 模式 至 少 要 选择 两 个 或 两 个 以 上 、 相 同 或 
不 同 的 变量 ; 观测 值 模式 对 应 分 类 轴 变 量 中 的 每 一 观测 值 生成 一 个 图 形 。 

下 面 重点 介绍 变量 描述 模式 的 条 形 图 绘制 方法 ， 其 他 方法 类 似 ， 读者 有 兴趣 可 自己 练 
习 操 作 即 可 。 

SPSS 变量 描述 模式 的 条 形 图 绘制 操作 过 程 如 下 : 

(1) 选择 Graphs 习 Legacy Dialogs 悦 Bar 选项 ， 弹 出 “Bar Charts” 对 话 框 。 该 对 话 框 
包含 3 种 图 示 类 型 的 单 选 和 3 种 统计 量 描述 模式 的 单 选 。 我 们 选择 分 组 条 形 图 (Clus- 
tered) 和 变量 描述 模式 (Summaries of separate variables) 。 选 择 后 单 击 Define 按钮 进入 
“Define Clustered Bar: Summaries of Separate Variables” 对 话 框 。 

(2) Category Axis 框 : 设置 分 类 轴 (默认 的 是 横 轴 ) 变量 。 分 类 轴 上 各 变量 的 排列 
位 置 是 由 分 类 变量 中 变量 值 的 大 小 和 字母 顺序 所 确定 的 ， re 
量 值 排 在 分 类 轴 的 最 左 端 。 Xx 

(3) Bars Represent 列表 框 : 存放 除 分 类 轴 变 量 以 外 沉 要 分 析 的 其 他 变量 。 即 从 左 侧 
窗口 中 将 这 些 变量 选择 到 右 侧 的 “Bars Represent 列 ; 框 中 。 

(4) 单 击 “Change Statistic. .. ”按钮 ， 设 转变 量 总 函数 。 系 统 默认 以 函数 Mean 
(平均 数 ) 对 选 入 的 变量 进行 汇总 ， 这 是 常用 的 沪 站 方式 ， 如 若 以 其 他 的 函数 形式 进行 汇 
总 ， 在 “Change Statistic” 对 话 框 中 提供 下 应 种 函数 可 供 选择 ， 在 此 不 一 一 列 出 。 

(5) Template 框 : 图 形 模版 格式 | 果 选 择 Use chart specifications from 复 选 框 ， 单 
击 “File” 按 钮 ， 则 会 弹出 “Usedeniplate from File” 对 话 框 ， 让 所 要 生成 的 图 形 套用 已 
有 的 模版 格式 。 一 般 可 直接 畏 抽 图 形 ， 不 套用 模版 格式 ， 六 

(6) 单 击 “Titles. XX 区 ， 设 置 图 形 标题 。 和 从 \Titles” 对 话 框 中 ,“Title” 对 话 杠 
设置 主 标题 ， 在 “Linel” | 和 “Line2” 文本 框 中 5 分 别 输 入 72 个 字符 或 36 个 汉字 ;“Sub- 
title” 文 本 框 设 置 副 标题 。 下 这- 

(7) 单 击 习 ntinue” 按 钮 ,返回 《人 fine Clustered Bar: Summaries of separate 
variables” 对 话 框 。 

(8) 单 击 “Options... ”按钮 ， 设 惫 缺失 值 处 理 方式 。 在 “Options” 对 话 框 中 ， 有 
如 下 选项 。 

中 Missing Values: 用 于 选择 缺失 值 处 理 方式 。 

a， 下 xclude cases listwise 单 选 按 钮 .得 除 有 缺失 值 的 个 案 , 是 系统 默认 选项 。 

b. Exclude cases variable by variable 单 选 按钮 ， 剔除 变量 中 的 缺失 值 。 

c，Display groups defined by missing values 复 选 框 : 显示 所 定义 的 缺失 值 组 。 

@ Display chart with case labels 复 选 框 : 显示 观测 值 量 的 标签 值 。 

图 Display error bars 复 选 框 : 在 图 形 中 显示 误差 条 形 图 。 

@ Error Bars Represent: 用 于 选择 误差 条 形 图 所 表达 的 统计 量 。 

a，Confidence intervals 单 选 按钮 : 误差 条 形 图 的 表征 ， 需 要 在 级 别 后 面 的 输入 框 制定 
需要 的 水 平 值 ， 默 认为 95. 0。 

b， Standard error 单 选 按钮 : 标准 误差 ， 需 要 在 乘 数 后 面 的 输入 框 指定 标准 误 的 倍数 。 

cStandard deviation 单 选 按钮 : 标准 差 . 需要 在 乘 数 后 面 的 输入 框 指定 标准 差 的 
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(9) 单 击 “Continue” 按 钮 ,返回 “Define Clustered Bar: Summaries of separate 
variables” 对 话 框 。 

(10) 单 击 “OK” 按 钮 ， 得 到 输出 的 条 形 图 。 结 果 显 示 在 数据 输出 窗口 。 

【 例 4. 11〗 中 国 2005 一 2014 年 的 出 生 率 和 死亡 率 数据 资料 如 表 4 - 21 所 示 ， 试 通过 
绘制 条 形 图 比较 这 段 时 间 的 出 生 率 和 死亡 率 。 


表 4-21 中 国 2005 一 2014 年 的 出 生 率 和 死亡 率 














年 份 出 生 率 /% 死亡 率 /% 
2005 12. 40 6. 51 
2006 12. 09 6. 81 
2007 12. 10 6.93 





2008 12.14 je RS 7.06 
2009 11.95 A\ EN 7.08 

















2010 11.90 Jy、 a | 7.11 
2011 11.93 ; 二 - 7. 14 
2012 ,Ba 7.15 
2013 NSD 08 7.16 














2014 Neh 12. 37 < 7.16 


资料 来 源 :《2015 中 国 统计 [Ee 


解 : 根据 SPSS 变 退 独 述 模式 的 条 形 阁 给 eno 我 们 设置 “年 份 ”为 分 类 轴 变 
量 ， 以 系统 默认 的 函数 -Mean 对 出 生 率 和 下 亡 玉 两 个 变量 进行 汇总 ， 则 分 别 绘 制 出 分 组 条 
ne 妨 图 4.5 和 图 4. se 


2. 饼 图 


饼 图 (Pie) 主要 用 来 表示 组 数 不 多 的 品质 资料 或 间断 性 数量 资料 的 内 部 构成 ， 各 部 
分 百分比 之 和 必须 是 100% 。 

饼 形 图 绘制 采用 的 统计 量 描述 模式 与 条 形 图 类 似 ， 也 可 分 为 3 种 类 型 ， 即 观测 量 分 类 
描述 模式 〈Summaries for Groups of Cases) 、 变 量 描述 模式 (Summaries of Separate Vari- 
ables) 和 观测 值 模式 (Values of Individual Cases) 。SPSS 饼 图 绘制 操作 过 程 如 下 : 

(1) 选择 “Graphs 一 Legacy Dialogs 习 Pie. .. ”选项 ， 弹 出 “Pie Charts” 对 话 框 。 该 
对 话 框 包含 3 种 统计 量 描述 模式 的 单 选 。 我 们 选择 观测 值 模式 (Values of Individual cases)。 
选择 后 单 击 “Define” 按 钮 ， 弹 出 “Define Pie : Values of Individual Cases” 对 话 框 。 

(2) 将 选择 分 析 变 量 存放 在 Slices Represent 列表 框 。 

(3) Slice Labels 选项 组 : 分 类 轴 的 标记 和 排列 方式 。 包括 2 个 单 选 按钮 。 

@ Case Number 单 选 按钮 : 表示 以 观测 量 的 序号 为 标记 来 排列 “Slices Represent” 
列表 框 内 的 变量 值 。 

@ Variable 单 选 按钮 : 表示 以 某 变 量 的 变量 值 为 标记 来 排列 Slices Represent 列表 框 
内 的 变量 值 。 
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图 4.6 2005 一 2014 年 出 生 率 和 死亡 率 的 分 段 条 形 图 


(4) 其 他 操作 与 条 形 图 类 似 。 最 后 单 击 “OK” 按 钮 ， 得 到 输出 的 饼 图 。 
【 例 4.12】 某 大 学 管理 学 院 2015 年 教师 的 职称 情况 如 表 4 - 22 所 示 。 试 通过 绘制 饼 
图 来 反映 该 学 院 教师 职称 的 比例 关系 。 
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表 4-22 某 大 学 管理 学 院 2016 年 教师 的 职称 情况 























职 称 人 数 
教授 9 
副教授 15 
讲师 34 
助教 12 
其 他 15 
合计 85 





解 : 根据 SPSS 观测 值 模式 的 饼 图 绘制 操作 步骤 ,我 们 以 “职称 ”的 变量 值 为 标记 来 
排列 人 数 ， 绘制 出 饼 图 ， 如 图 4.7 所 示 。 
反 
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【拓展 视频 】 
\S 
图 4.7 2016 年 教师 职称 的 饼 图 
3. 线形 图 


线形 图 (Line) 主要 用 于 描述 现象 在 时 间 上 的 变化 趋势 、 现 象 的 分 配 情况 和 现象 的 依 
存 关系 等 。 线 形 图 有 3 种 图 示 类 型 ， 即 单线 形 图 (Simple)、 多 线形 图 (Multiple) 和 垂 线 
形 图 (Drop -line); 线形 图 绘制 采用 的 统计 量 描述 模式 与 条 形 图 类 似 ， 也 可 分 为 3 种 类 
型 ， 即 观测 量 分 类 描述 模式 (Summaries for groups of cases)、 变 量 描述 模式 (Summaries 
of separate variables) 和 观测 值 模式 (Values of individual cases) 。 

下 面 重点 介绍 变量 描述 模式 下 多 线形 图 的 绘制 方法 ，SPSS 变量 描述 模式 下 多 线形 区 
的 操作 过 程 如 下 : 

(1) 选择 “Graphs 一 Legacy Dialogs 一 Line...” 选 项， 弹出 “Line Charts” 对 话 框 。 
该 对 话 框 包含 3 种 图 示 类 型 的 单 选 和 3 种 统计 量 描述 模式 的 单 选 。 我 们 选择 多 线 
(Multiple) 和 变量 描述 模式 (Summaries of separate variables) 。 选 择 后 单 击 “Define” 按 
钮 ， 弹 出 “Define Multiple Line : Summaries of separate variables” 对 话 框 。 

(2) 选择 分 析 变 量 及 其 他 相关 设置 。 这 部 分 操作 与 条 形 图 类 似 ,不 再 阐述 。 
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【 例 4.13】 某 地 区 2006 一 2015 年 各 季度 某 种 商品 销售 量 资料 如 下 : 


















































表 4-23 某 地 区 2006 一 2015 年 各 季度 某 种 商品 销售 量 (单位 ; t) 

年 份 第 一 季度 第 二 季度 第 三 季度 第 四 季度 

2006 9 13 16 6 

2007 11 14 17 10 

2008 8 16 21 6 

2009 10 12 20 8 

2010 12 15 16 10 

2011 15 17 25 11 

2012 7 19 28 9 

2013 17 28 50 20 

2014 19 40 了 入 地 

2015 21 49 Ved, 25 
试 通过 绘制 线 te j 千 量 的 年 际 变化 。 
解 : 根据 SPSS 变量 描述 模式 下 多 线形 图 的 绘 E 步 又， 我 们 设置 “年 份 ”为 分 类 轴 变 

量 ， 以 系统 默认 的 函数 Mean 对 ie "4 则 绘制 出 的 线形 图 如 图 4. 8 所 示 。 
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2006 2007 2008 2005 2010 2011 2017 2013 2014 2015 
年 份 
图 4.8 某 地 区 2006 一 2015 年 各 季度 某 种 商品 销售 量 的 变化 分 析 


4. 散 点 图 


散 点 图 (Scatter) 是 以 点 的 分 布 反映 变量 之 间 相 关 情 况 的 统计 图 形 。 散 点 图 共有 5 种 
图 示 类 型 ， 分 别 是 简单 散 点 图 (Simple)、 重 从 散 点 图 (Overlay)、 和 矩阵 散 点 图 (Matrix) 
和 三 维 散 点 图 (3 - D) 和 个 值 散 点 图 。 其 中 ， 简 单 散 点 图 只 显示 一 对 相关 变量 的 散 点 图 ， 
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重 县 散 点 图 可 显示 多 对 相关 变量 的 散 点 图 ， 和 矩阵 散 点 图 是 在 和 矩阵 中 显示 多 个 相关 变量 的 散 


点 图 三维 散 点 图 显示 3 个 相关 变量 的 散 点 图 ,个 值 散 点 图 只 描述 一 个 变量 在 数 轴 上 的 分 


布 ， 类似 直方 图 。 
SPSS 简单 散 点 图 操作 过 程 如 下 : 
(1) 选择 “Graphs-Legacy Dialogs 悦 Scatter/Dot. ..” 选 项， 弹出 
话 框 ， 包 括 4 个 图 示 类 型 单 选 按钮 。 








“Scatter/Dot” 对 


Oz 简单 散 点 图 : 选择 “Simple Scatter” 选 项 ， 然 后 单 击 “Define” 按 钮 进入 “Simple 


Scatterplot” 对 话 框 。 指 定 某 个 变量 为 散 点 图 的 纵 轴 变 量 选 入 “YY Axis” 


框 中 ， 指 定 某 个 


变量 为 散 点 图 的 横 轴 变量 ， 选 人 “X Axis” 框 中 。“Set Markers by” 框 和 “Label Cases 





by” 框 不 常用 ， 可 以 省 略 。 





@ 重合 散 点 图 ， 选择 “Overlay Scatter” 选 项 ， 然 后 单 击 ne” 按 钮 进入 “Overlay 





Scatterplot Matrix” 对 话 框 。 在 左 侧 的 变量 框 中 选择 一 对 过 


X Pairs” 框 中 ， 


“Y Variable” 是 Y 轴 变 量 ，“X Variable” 是 X 轴 变 量 ， 人 选择 两 对 变量 进入 “Y-X 


Pairs” 框 中 。 


图 矩阵 散 点 图 : 选择 Matrix Scatter 选项 AN “Define” 按 钮 进入 “Scatter- 





bles” 框 中 ， 和 矩阵 变量 框 内 的 变量 顺序 与 点 图 时 角 线 变量 的 顺序 相同 。 





话 框 。 在 左 侧 的 变量 框 中 选择 起 两 个 以 上 的 变量 进入 。 “Matrix Varia- 


@ 三 维 散 点 图 选择 “3 - D SGNHERE 选项， 然后 单 击 “Define” 按钮 进入 “3 - 
Scatterplot” 对话 框 。 et ‘YY Axis “X Axis 
A 


“Z Axis” 框 中 。 











@ 个 值 散 点 图 : a 
Simple Dot Polt” 对 话 框 ， 选择 要 分 析 的 变量 
《2 不 再 
地 区 oe 工业 总 产值 、 农 业 总 产 


“Shple Dot” 选 项 ， A 击 “Define” 按 钮 进入 “Define 
*X 一 Axis Variable” 框 中 。 
































【 例 4. 14 值 的 统计 数据 如 
表 4-24 所 示 .: 
表 4-24 2005 一 2014 年 的 发 电量 与 工业 总 产值 、 农 业 总 产值 的 统计 数据 
年 份 发 电量 Y/ 亿 度 工业 总 产值 Xi / 亿 元 农业 总 产值 X:/ 亿 元 
2005 13320 1165.5 1304 
2006 13404 1171.2 1325 
2007 13602 1174.1 1360 
2008 13796 1180.6 1395 
2009 13921 1187.9 1465 
2010 14153 1198.8 1465 
2011 14449 1218.6 1545 
2012 14733 1224. 2 1620 
2013 15162 1228. 9 1736 
2014 15595 1330. 3 1816 














(1) 试 绘制 发 电量 与 工业 总 产值 的 简单 散 点 图 。 


(2) 试 绘制 发 电量 与 工业 总 产值 、 发 电量 与 农业 总 产值 的 重 和 至 散 点 图 。 
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(3) 试 绘制 发 电量 、 工 业 总 产值 和 农业 总 产值 的 矩阵 散 点 图 

(4) 试 绘制 发 电量 、 工 业 总 产值 和 农业 总 产值 的 3-D 散 点 图 。 

解 : (1) 将 “发 电量 ” 选 和 信 “Y Axis” 框 , “工业 总 产值 ” 选 人 “X Axis” 框 。 按 照 
SPSS 简单 散 点 图 的 操作 步 又， 得 到 简单 散 点 图 4. 9。 
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1150.0 ER 1250.0 1300.0 1350.0 
AN 工业 总 产值 活 
”图 4.9 简单 散 点 图 -六 
分 别 选 入 ， “YY-X Pairs” 框 中 ， 按 


(2) 将 发 电量 与 - rt 发 电量 与 农业 总 
照 SPSS 重 矢 散 点 图 的 操作 步 双 得 到 重 交点 四 10。 

















wl 户 
/ 
a 
15500 上 
@ 
15000F 
5 
14500|- 站 
5 6 
14000 上 i 
和 5 
13500F- 
5 8 
E 
13000F 
1200 1400 1600 1800 


图 4.10 重合 散 点 图 
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(3) 将 发 电量 、 工 业 总 产值 和 农业 总 产值 选 入 “Matrix Variables” 框 中 ,按照 SPSS 











矩阵 散 点 图 的 操作 步骤 ， 得 到 矩阵 散 点 图 4. 11。 
是 了 
世 W a 
. 8 Ei 
= o o 
日 0 i 


农业 总 产值 
o 





00.0 
工业 总 产值 


图 4.12 3-D 散 点 图 














工 邮 总 产值 农业 总 产值 





(4) 将 发 表 汪 工业 总 产值 和 农业 总 产 人 分 
别 迁 入 “Ys™ “XAxis”*Z Axis 框 中 ， 按 
照 SPSS 入 点 图 的 所 作 步 强 ， 得 到 三 维 散 点 
涩 4, 12) 

PA i 

直方 图 (Histogram) 用 于 观察 某 个 变量 的 
分 布 情况 ， 适用 于 连续 型 数据 变量 。SPSS 直方 
图 操作 过 程 如 下 : 

(1) 选择 “Graphs 一 Legacy Dialogs 一 
Histogram. .. ”选项 ， 弹 出 “Histogram” 对话 框 。 

(2) 将 需要 分 析 的 变量 选 人 “Variable” 
框 中 。 


(3) 选择 “Display normal curve” 选 项 ,设置 显示 正 态 分 布 曲 线 。 系 统 默认 不 显示 。 


(4) 其 他 操作 同 条 形 图 类 似 。 
4.4.2 统计 图 的 编辑 
1. 图 形 编辑 窗口 





选中 要 编辑 的 图 形 ， 双 击 后 便 可 从 输出 窗口 切换 到 “Chart Editor” 图 形 编辑 窗口 ， 
图 形 进 入 编辑 状态 。 在 图 形 编辑 窗口 内 分 为 编辑 图 形 的 功能 菜单 和 工具 栏 两 部 分 ， 下 面 结 
合 具体 的 图 形 编辑 方法 介绍 与 其 相关 的 功能 。 
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2. 设置 图 形 中 的 数值 标签 


该 功能 可 以 显示 条 形 图 中 的 条 形 图 、 饼 图 中 的 扇 、 线 图 中 的 点 所 代表 的 数值 ， 如 频数 
或 频率 等 ， 或 散 点 图 各 个 观测 值 的 数值 等 。 

操作 方法 : 选择 要 显示 的 数值 图 列 ， 在 “Chart Editor” 窗 口 菜单 中 选择 “Elements 
一 Show Data Labels” 选 项 ， 则 图 形 中 所 有 的 条 内 都 标 出 数值 。 同 时 弹出 “Properties” 对 
话 框 ， 从 中 选择 一 种 颜色 后 ， 单 击 “Apply” 按 钮 ， 即 可 改变 数值 字体 的 原 有 颜色 。 

3. 转换 坐标 轴 

在 二 维 的 条 形 图 、 线 图 、 直 方 图 中 有 两 个 坐标 轴 ， 我 们 可 以 转换 坐标 轴 ， 使 图 形 显示 
更 美观 。 

操作 方法 : 在 “Chart Editor” 窗 口 菜单 中 选择 “Options epse Chart” 选 项 ， 
即 可 将 两 个 轴 互 换 。 XK 2 

编辑 后 的 条 形 图 如 图 4. 13 所 示 。 AN \ 
一 一 





国 出 生来 
国 死 亡 率 











图 4.13 编辑 后 的 条 形 图 


4. 分 离 饼 图 

为 了 强调 饼 图 中 若干 扇面 ， 可 以 将 它们 从 饼 图 中 分 离 出 来 。 

操作 方法 : 选择 要 分 离 的 扇面 。 在 “Chart Editor” 窗 口 菜 单 中 选择 “Elements 一 下 x- 
plode Slice” 选 项 ， 即 可 产生 分 离 的 扇面 。 单 击 “Return Slice” 按 钮 恢复 分 离 扇 面 。 


5. 改变 散 点 图 点 的 样式 
为 了 使 散 点 图 中 的 点 显示 更 加 清晰 。 可 以 对 选中 的 点 进行 修饰 。 
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图 4.14 编辑 后 的 饼 图 。 1 


操作 方法 : 选中 散 点 图 中 的 点 ， 右 击 选择 “Proper aow" 选项 ， 弹 出 “Prop- 
erties” 对 话 框 。 在 “Marker” 选 项 卡 中 ， sn Type)、 点 的 大 小 〈Size) 、 点 
的 外 周 线 (Border Width) 及 点 的 颜色 CS 

6. 修饰 图 形 A 

1) 填充 与 边框 A 


TRY 域 进行 填 色 或 增加 低 纹 ; 边框 是 对 选中 的 区 域 
增加 线 框 ， 改 变 边框 的 线 型 > > 


94 









操作 方法 : 选中 需 填充 颜色 的 区 域 ， 右 1 NT Eroperties Window” 选 项 ， 弹 出 
“Properties” 对 话 框 。 在 WFill&.Boder” 选 项 卡 择 填充 颜色 及 边框 颜色 ， 最 后 单 击 
“Apply” 按 钮 即 可 站 x 


入 De 


图 形 中 的 交 学 包括 Text Box 输入 的 文本 、Title 图 形 标 题 、Subtitle 副标题 、Foot- 
note 脚注 、Axis Title 轴 题 、 坐 标 Axis Value Label 轴 数 值 标签 等 。 

操作 方法 : 选中 需要 修饰 文字 的 区 域 ， 右 击 选择 “Properties Windows” 选 项 ， 弹 出 
“Properties” 对 话 框 ， 选择 “Text Style” 文 字 选 项 卡 。 

(1) Preview in Preferred Size: 显示 所 选 的 文字 的 字体 、 字 号 、 字 样 、 颜 色 和 排列 
市 武 ， 

(2) Font 文字 栏 : 选择 字体 、 字 号 及 样式 。 

(3) Color 颜色 栏 : 选择 字 的 颜色 。 

(4) 最 后 单 击 “Apply” 按 钮 即 可 。 


4.5 多 选 题 分 析 


多 选 题 分 析 是 针对 问卷 调查 中 的 多 项 选择 问题 的 。 它 是 根据 实际 调查 需要 ， 要 求 被 调 
查 者 从 问卷 给 出 的 若干 个 备 选 答案 中 选择 一 个 以 上 的 答案 ， 然 后 计算 这 些 多 项 选择 的 总 频 
数 和 频率 等 。 
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4.5.1 多 选 问题 的 分 解 


通常 ， 解 决 多 选 问题 是 将 一 个 多 项 选择 问题 分 解 成 若干 个 问题 ， 对 应 设置 若干 个 
SPSS 变量 ,分 别 存 放 被 描述 这 些 问题 的 几 个 可 能 备 选 答案 。 这 样 ， 对 一 个 多 选 问题 的 分 
析 就 可 以 转化 成 对 多 个 问题 的 分 析 ， 也 就 是 对 多 个 SPSS 变量 的 分 析 。 多 选 问题 的 分 解 方 
法 通常 有 多 选 二 分 法 和 多 选 分 类 法 两 种 。 

1. 多 选 二 分 法 

多 选 二 分 法 (Multiple Dichotomies Method) 只 适用 于 笼统 的 多 选 问题 中 ， 即 每 人 每 
次 可 以 从 备 选 答案 中 任意 选择 若干 项 。 多 选 二 分 法 是 将 多 选 问 题 中 的 每 个 备 选 答案 设 为 一 
个 SPSS 变量 ， 每 个 变量 只 有 0 或 1 两 个 取 值 ， 分 别 表示 选择 了 该 答案 和 不 选择 该 答案 。 
例如 ， / 





ss 
请 问 您 不 听 广 播 的 原因 是 什么 ? [ 复 选 ] NY 
没 时 间 听 一 1 没有 收听 工具 一 2 没有 收听 又 人 泊 播 节 目 不 感 兴趣 一 4 
其 他 媒体 已 经 满足 需要 一 5 。 ”音质 不 好 、 其 他 一 7 











这 是 一 个 多 选 问题 不 同 的 从 RA 答案 的 数目 可 能 不 同 ， 每 人 每 次 最 多 可 能 会 

。 对 于 类 似 的 问卷 ， 可 以 宛 各 个 备 过 和 案 作为 所 个 变量 来 定义 ， 共 定义 7 个 

se 每 个 变量 具有 0 越 岂 丙种 选择 ， 其中 0 二 中， 1 表示 选中 。 具 体 分 解 结 
果 如 表 4 - 25 所 示 。 > 


» | 表 4-25 2 




























量 名 标签 变量 什 

没 时 间 听 0 一 不 选 ，1 一 先 
A2 没有 收听 工具 0 一 不 选 ，1 一 选 
A3 没有 收听 习惯 0 一 不 选 ，1 一 移 
Ad 对 广播 节目 不 感 兴趣 0 一 不 选 ，1 一 先 
A5 其 他 媒体 已 经 满足 需要 0 一 不 选 ,1 一 选 
A6 音质 不 好 、 听 不 清楚 0 一 不 选 ,1 一 选 
A7 其 他 0 一 不 选 ，1 一 先 











2. 多 选 分 类 法 

多 选 分 类 法 (Maultiple Category Method) 是 指 首先 应 估计 多 选 问题 中 最 多 可 能 出 现 
的 答案 个 数 ， 然 后 为 每 个 答案 设置 一 个 SPSS 变量 。 变 量 取 值 为 多 选 问题 中 的 备 选 答案 。 

例如 ， 在 前 面 广播 收听 的 问题 中 ， 如 果 规 定 被 调查 者 只 能 从 7 个 备 选 答案 中 选择 3 个 
答案 ， 则 只 需 定义 3 个 SPSS 变量 ， 分 别 表示 第 一 选项 、 第 二 选项 和 第 三 选项 。 变 量 取 值 
是 1 一 7。 具 体 分 解 结果 如 表 4- 26 所 示 。 
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表 4-26 多 选 分 类 法 举例 











SPSS 变量 名 变量 名 标签 变量 值 
Al 第 一 选项 1/2/3/4/5/6/7 
A2 第 二 选项 1/2/3/4/5/6/7 
A3 第 三 选项 1/2/3/4/5/6/7 











4.5.2 多 选 题 的 频数 分 析 


1. 定义 多 选 变量 集 

定义 多 选 变量 集 是 将 多 选 问 题 分 解 并 设置 成 多 个 变量 后 ea 
它 是 为 多 选 问题 的 频数 分 析 做 准备 。 po Ra 如 下 

(1) 选择 “AnalyzeMultiple Se ”选项 ， 弹 出 “De- 
fine Multiple Response Sets” 对 话 框 。 0 

(2) 从 左 侧 列表 框 的 变量 清单 + Mi 二 变量 选择 到 右 侧 的 “Variables in 
Set” 列 表 框 中 。 

(3) Variables Are Coded As ES 变量 集中 的 变量 分 解 方法 。 包 括 2 个 
单 选 按钮 。 

Q@ Dichotomies 单 选 按钮 ， 二 2 二 分 法 分 解 污 Counted value” 文 本 框 中 
输入 对 哪 组 值 进行 分 析 。SPSS Si 规定 等 于 该 值 的 本 ， 其 余 样本 为 男 一 组 。 例 如， 
在 “Counted value” 文 赤 棋 汕 可 输入 1， i fs (如 规定 “1 表示 “选中 ” 管 
案 ) 的 样本 组 进行 分 析 。 TW 

©@ Cate ories 只 选 按 乌 ， 表示 以 国 放 分 类 法 分 角 并 在 “Range” 文 本 框 和 
“through” 文 分 别 输入 变量 取 值 的 最 小 值 和 最 大 值 。 

(4) Name 文本 框 ， 为 多 选 变量 集 命 名 。 系 统 会 自动 在 该 名 字 前 加 字符 $ 。 

(5) Label 文本 框 : 多 选 变量 集 名 标签 。 

(6) 单 击 “Add” 按 钮 ， 将 定义 好 的 多 选 变量 集 加 到 “Mnultiple Response Sets” 列 表 
框 中 。SPSS 可 以 定义 多 个 多 选 变量 集 。 

(7) 单 击 “Close” 按 钮 ， 即 可 完成 多 选 变量 集 的 定义 。 

2. 多 选 题 的 频数 分 析 

多 选 变量 集 定 义 完 后 ， 就 可 以 进行 多 选 题 的 频数 分 析 。SPSS 多 选 题 频数 分 析 的 操作 
过 程 如 下 : 

(1) 选择 “Analyze 一 Multiple Response 一 Frequencies... ”选项 ， 弹 出 “Multiple 
Response Frequencies” 对 话 框 。 

(2) 将 左 侧 “Multiple Response Sets” 列 表 框 存放 的 多 选项 变量 集 选择 到 右 侧 的 
“Table(s) for” 列 表 框 中 。 

(3) Missing Values 选项 组 : 指定 是 否 处 理 缺 式 数据 。 包 括 2 个 复 选 框 。 

人 Exclude cases listwise within dichotomies 复 选 框 : 适用 于 多 选 二 分 法 。 
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回 Exclude cases listwise within categories 复 选 框 : 适用 于 多 选 分 类 法 。 

(4) 单 击 “OK” 按 钮 ， 即 可 完成 多 选 题 的 频数 分 析 。 分 析 结 果 显 示 在 数据 输出 窗口 。 

【 例 4.15】 在 前 面 的 广播 收听 调查 问卷 中 ， 抽 样 调查 50 人 。 试 针对 表 4-25 和 表 4-26 






















































































两 种 变量 分 解 方法 进行 多 选 题 的 频数 分 析 。 回 对 jp 回 

解 : (1) 表 4-25 是 用 多 选 二 分 法 进行 变量 分 解 的 。 建 立 数据 文件 ， 如 re 

表 4-27 所 示 ， 按照 SPSS 多 选 题 频数 分 析 的 操作 步骤 ， 得 到 输出 结果 如 。 回 3 
表 4-28 所 示 。 【拓展 视频 】 
表 4-27 多 选 二 分 法 数据 文件 

序 号 Al A2 A3 A4 AS A6 A7 

0 1 1 0 

2 0 0 1 

3 1 1 1 0 

4 1 1 0 0 

5 0 1 1 0 

6 0 0 1 0 

条 0 0 1 0 

8 1 0 1 0 

9 0 1 1 0 

10 1 二 1 1 

11 0 到 0 1 

12 a | 0 这 

13 六 OAT 0 0 

14 NS E 0 0 1 

15 了 0 1 0 

16 0 0 1 0 

17 0 1 h 0 

18 0 1 0 

19 0 0 1 1 

20 1 0 0 1 

21 0 1 0 1 

22 1 1 0 Ll 

23 和, 1 0 1 

24 1 1 0 1 

25 0 0 0 1 

26 0 0 1 0 

27 0 0 1 0 

28 1 0 1 0 
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( 续 ) 
A6 A7 
29 1 0 
30 Y 1 
1 0 EL 
32 0 1 
33 0 1 
34 0 1 
35 0 1 
36 0 
37 0 1 
38 1 0 
39 1 0 
40 1 0 
41 1 0 
42 1 0 
43 0 0 
44 0 0 
45 0 0 
46 0 0 
47 0 ' 
48 0 1 
49 0 1 
50 0 1 


























































了 Percent of Cases 

没 时 间 听 19 10.9% 38.0% 

没有 收听 工具 25 14.3% 50.0% 

没有 收听 习惯 29 16.6% 58.0% 

$$ x | 对 广播 节目 不 感 兴趣 28 16.0% 56.0% 
其 他 媒体 已 经 满足 需要 26 14.9% 52.0% 

音质 不 好 、 听 不 清楚 2 13.1% 46.0% 

其 他 25 14.3% 50.0% 

Total 195 100.0% 350.0% 














a. Dichotomy group tabulated at value 1. 


第 4 章 
SPSS 的 简单 应 用 | 135 


表 4-28 输出 结果 解释 : 
第 1 列表 示 二 分 法 变量 标签 。 

第 2 列 (N) 表示 选中 频数 。 即 50 名 被 调查 者 的 总 选中 次 数 是 175 次 ， 其 中 选中 “ 没 
有 收听 习惯 ”的 次 数 最 多 ， 达 到 29 次 。 

第 3 列 (Percent) 表示 选中 百分比 ， 即 频率 。 例 如 ， 选 择 “ 没 时 间 收 听 ” 的 选中 百 分 
比 为 10.9%( 即 为 19 二 175X100%)， 它 的 分 母 是 总 选中 次 数 175 。 

第 4 列 (Percent of Cases) 也 表示 选中 百分比 ,但 其 分 母 是 样本 数 50。 通 常 该 列 数据 
只 作 参 考 。 

(2) 表 4-26 是 用 多 选 分 类 法 进行 变量 分 解 的 。 建 立 数据 文件 ， 如 表 4 一 29 所 示 ， 按 
照 SPSS 多 选 题 频数 分 析 的 操作 步骤 ， 得 到 输出 结果 如 表 4 一 30 所 示 。 




























































































Al A2 A2 A3 
1 1 3 6 3 7 
2 3 5 7 27 秆 1 4 6 
3 1 2 4 \ 3 4 5 
1 1 5 7 -~ mh 了 2 7 
5 6 4 人 30 2 3 5 
6 1 区 SSS 31 了 3 5 
7 2 3 A 32 = 4 6 

二 > 

8 2 2 7 38"A1 lL 6 | 
9 Xe > 7 3 5 
10 > 3 过 2 5 7 
11 Na 6 7 节 各 ”36 3 4 5 
12 2 6 7 37 6 7 
13 1 4 6 38 1 2 3 
14 1 3 7 39 2 3 5 
15 2 4 6 40 5 6 7 
16 1 3 4 41 1 3 5 
17 了 5 42 2 5 6 
18 4 5 6 43 3 4 6 
19 1 4 44 1 7 
20 3 5 6 45 2 3 4 
并 1 6 7 16 2 3 6 
22 3 5 6 47 4 5 6 
23 2 4 7 48 1 4 7 
24 3 4 49 2 4 5 
25 4 5 6 50 ‘ 2 3 
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表 4-30 多 选 题 的 频数 分 析 (分 类 法 ) 


















































Responses 
Percent of Cases 
N Percent 
没 时 间 听 20 13.3% 40.0% 
没有 收听 工具 23 15.3% 46.0% 
没有 收听 习惯 26 17.3% 52.0% 
$y 对 广播 节目 不 感 兴趣 20 13.3% 40.0% 
其 他 媒体 已 经 满足 需要 21 14.0% 42.0% 
音质 不 好 、 听 不 清楚 21 14.0% 42.0% 
一 
其 他 19 12.7% 3 38.0% 
2 
Total 150 1 300.0% 
a. Group < ~« 
a ] 
表 4- 30 输出 结果 解释 : SS- 


第 1 列表 示 分 类 法 变量 标签 。 SC 

第 2 列 (N) 表示 选中 频数 。 即 Sa 碍 者 的 总 选中 次 数 是 150 ( 即 50X3) 次 ， 
其 中 选中 “没有 收听 习惯 ”的 次 数 最 多 达到 26 次 。 

第 3 列 (Percent) 表示 选中 百 疮 比 ， 即 频率 。 例 如 驯 择 “ 没 时 间 收 听 ” 的 选中 百 分 
比 为 13.3%( 即 为 20+150R100%)， 它 的 分 母 站 泌 中 次 数 150。 

第 4 列 (Percent of@&asef) ti 50。 通 常 该 列 数据 
只 作 参 考 。 2 入 x 


YA pa 
oar > 


SPSS 和 Excel 软件 在 统计 学 中 的 应 用 及 比较 


SPSS 是 SPSS 公司 研发 的 一 套 大 型 集成 应 用 软件 ， 具 有 完备 的 数据 存 取 、 数 据 分 析 、 数 据 管 理 和 数 
据 展 现 等 功能 。Excel 是 美国 微软 公司 开发 的 在 目前 Windows 环境 下 广泛 使 用 的 整合 性 软件 包 ， 一 般 被 
用 于 数学 运算 、 制 作 分 析 图 表 、 实 现 数据 的 自动 处 理 、 资 料 分 析 等 。 目 前 SPSS 和 Excel 在 统计 学 中 已 经 
成 为 最 基本 的 数据 处 理 软件 之 一 ， 这 两 种 软件 在 应 用 过 程 中 有 这 不 同 的 优势 ， 也 有 着 各 自 的 不 足 和 局 限 
性 。 下面 对 这 两 种 软件 进行 比较 分 析 。 以 便 在 统计 学 的 实际 应 用 中 选择 更 适 配 的 软件 。 

1. SPSS 在 统计 学 中 的 应 用 特点 

1) 操作 界面 直观 

SPSS 界面 是 菜单 式 ， 主 窗口 名 为 SPSS for Windows。 在 SPSS 的 主 窗口 中 还 有 两 个 窗口 : 一 个 是 数 
据 管理 窗口 ， 其 标题 名 称 是 “Newdata"”， 且 默认 为 激活 状态 ， 而 其 数据 管理 器 是 一 种 典型 的 电子 表格 形 
式 ， 用 户 可 通过 定义 变量 名 、 格 式 化 数据 类 型 后 输入 原始 数值 ， 并 可 根据 需要 对 数据 进行 增删 、 剪 贴 、 
修改 、 存 储 等 操作 ; 另 一 个 是 结果 输出 窗口 。 标 题名 称 是 “! Output!1”， 启动 时 为 非 活动 窗口 ， 只 有 当 
完成 一 项 处 理 后 。 才 在 该 窗口 显示 处 理 过 程 提 示 和 计算 完成 。 

2) 编辑 、 表 格 、 图 表 功 能 

在 SPSS 的 数据 编辑 窗口 中 ,不 仅 可 以 进行 增加 、 误 除 、 复 制 及 草 贴 等 常规 操作 ,还 可 以 对 数据 文 
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件 中 的 数据 进行 排序 、 转 换 、 拆 分 、 聚 合 、 加 权 等 操作 ， 并 可 生成 数 十 种 风格 的 表格 、 图 形 、 包 括 基本 

图 和 交互 图 。SPSS 的 高 版 本 中 ,统计 成 果 多 被 归纳 为 表格 和 (或 ) 图 形 的 形式 。 

3) 与 其 他 软件 的 链接 

SPSS 能 打开 Excel、DaBase、Foxbase、Lotusl -2-3、Access、 文 本 编辑 器 等 生成 的 数据 文件 。 例 
如 ， 与 Excel 的 数据 进行 转换 ， 操 作 方 法 如 下 : 选择 File>Open 选项 ， 进 入 “Open File” 对 话 框 ， 浏 览 
并 找到 需要 转换 的 文件 “. xls”， 选 中 该 文件 ， 双 击 文件 (或 单 击 “ 打 开 ” 按 钮 )， 在 对 话 框 的 上 方 给 出 
了 文件 的 路 径 , “Read variable names from the first row of data” 意 思 是 询问 是 否 将 电子 表格 文件 的 第 一 
行 读 作 变 量 名 。”Worksheet“ 后 面 的 选项 主要 对 需要 转换 的 工作 表格 进行 选择 。 假 设 选择 首 项 A2 与 尾 
项 D8 的 数据 ， 则 定义 为 A2: D8, 将 A2: D8 包含 的 所 有 数据 选 入 即将 形成 的 数据 文件 ， 然 后 点 击 
“OK” 按 钮 即 转换 完毕 。 

4) 统计 分 析 功 能 齐全 

SPSS 包括 了 统计 学 中 所 采用 的 大 部 分 统计 方法 。 除 了 最 常用 的 平均 和 (Means)、! 检验 〈(t- 
Test)、 方 差分 析 (Anova) 、 回 归 分 析 (Reg)、 相 关 分 析 (Corr) 外 ,y 还 a 近 性 分 析 、 可 靠 性 分 
析 、 生 存 分 析 、 生 命 表 分 析 、 聚 类 分 析 、 快 速 聚 类 分 析 、 ng 

2. SPSS 和 Excel 的 应 用 比较 A 

(1) SPSS 提供 的 绘图 系统 能 绘制 各 种 统计 图 表 ， RX 定 的 程序 语言 基础 ， 操 作 方 面 不 如 
Excel 简便 快捷 。 

(2) 利用 tps WS (包括 可 重复 双 因 素 和 无 重复 双 因 素 ) 的 方 
差分 析 ， 对 于 涉及 两 因素 随机 区 组 试验 结果 区 2 也 不 能 运用 于 更 复杂 的 三 因素 试验 和 有 裂 区 
试验 等 结果 的 统计 分 析 。 即 使 进行 单 因素 Nh 方差 分 析 也 只 能 给 出 方差 分 析 表 ， 不 能 进行 平均 数 
的 多 重 比较 ， 更 无 法 用 字母 标记 法 进行 交 + 性 结果 。 对 于 高 经 统计 ， 如 模型 统计 、 多 重 响应 分 
析 等 ， 使 用 Excel 是 无 法 完成 的 下 圳 ， 则 说 采用 SPSS 进行 汾 折 9% 

(3) SPSS 程序 模式 化 人 染 设 计 的 人 员 来 说 ， 程 序 编写 显得 烦琐 而 
不 宜 掌握 ， 半生 作 也 

资料 来 源 : okt Esctl 和 SPss 软件 i [J]. 企业 科技 与 发 展 ， 


2009(22) ， AS 省 
本 章 小 结 





本 章 主 要 介绍 了 SPSS 22.0 中 的 基本 功能 和 常用 统计 分 析 方 法 的 操作 步骤 ， 主 要 
包括 建立 数据 文件 、 编 辑 价格 数据 和 保存 数据 文件 。 此 外 ， 对 数据 观测 量 、 变 量 进行 
编辑 加 工 处 理 时 ， 将 主要 使 用 “数据 ”(Data) 菜单 和 “转换 ”(Transform) 菜单 ;对 


数据 的 总 体 特征 进行 归纳 时 ， 将 主要 使 用 “分 析 ” (Analyze) 中 的 “描述 ” (Descrip- 
tive Statistics) 菜单 和 “多 重 响应 分 析 ”(Multiple Response) 选项 。 由 于 图 表 易 于 展 
示 数 字 关 系 的 特点 .因此 ,在 统计 分 析 中 .“ 图 形 ”(Graphs) 菜单 使 用 极为 广泛 。 





关键 术语 


SPSS 22.0 社会 科学 统计 软件 包 22.0 SPSS data editor 数据 编辑 器 
Variable View 变量 视 区 Data View 数据 视 区 
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习 题 4 
一 、 选 择 题 人 险 
. 下 列 有 关 变 量 名 称 的 命名 规则 ， 错 误 的 是 ( 。 ): A 
A. 每 一 个 变量 名 称 都 必须 是 唯一 的 ,站 
B. 第 一 个 字符 必须 是 中 文 或 英文 字母 WY 


C. 变量 名 称 可 使 用 64 个 全 /半角 字符 AN 

D. 变量 名 称 允许 使 用 任意 大 小 写 / 

2. 下 列 有 关 变 最 可 选用 的 主要 数 沁 甘油， 错误 的 是 (。。)。 

A. 数值 型 B. 日 期 >、 C. 时 间 ,4 、 D. 字符 中 

3. 下 列 有 关 “ “缺失 值 ” Missii Value) | ys 

A. 单元 格 未 输入 内 容 ， 将 自动 被 视 为 缺 9 

B. 数值 列 若 输入 6， 将 自动 被 视 为 系统 缺 尖 

C. 除了 系统 拒 估 也 允许 用 户 自 定义 侯 关 

D, 自 定义 缺 央 可 以 是 数值 范围 或 不 连续 的 离散 数值 

4 下列 有 疾 定义 变量 的 叙述 ， 错 误 的 是 ( 。 )。 

A. 若 未 自行 命名 ， 而 直接 输入 数据 ，SPSS 将 根据 字段 顺序 以 VAR1，VAR2， 
VAR3，… 进 行 命名 

B. 小 数 长 度 至 少 要 比 数据 域 的 总 长 度 少 一 位 

C. 标签 是 改变 数据 列 名 称 在 输出 时 的 显示 方式 ， 若 未 定义 将 直接 显示 列 名 

D. 数值 是 改变 答案 内 容 在 输出 时 的 显示 方式 ， 若 未 定义 将 直接 显示 其 实际 数据 内 容 

二 、 简 答题 

1 SPSS 的 变量 的 命名 规则 是 什么 ? 

2. 如何 定义 变量 的 “标签 ”与 “数值 "? 其 作用 是 什么 ? 

3、SPSS 软件 的 行 、 列 分 别 代表 什么 ? 为 何 行 、 列 不 能 互 换 ? 

4，SPSS 的 变量 有 几 种 类 型 ? 

5。Column 和 Width 都 表示 变量 的 宽度 。 它 们 之 间 有 何 差异 ? 

6. 为 什么 要 合并 数据 文件 ? 合并 数据 文件 有 几 种 情况 ? 

7. 多 选 问 题 有 哪 两 种 分 解 方法 ? 试 举例 说 明 这 两 种 分 解 方法 有 什么 区 别 。 

8. 表 4-31 是 一 种 什么 样 的 输出 表 ? 它 与 Frequencies 过 程 产生 的 表格 有 什么 区 别 ? 
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表 4-31 输出 表 
N Percent 了 Percent of Cases 
听 戏 看 电影 87 23.6 48. 1 
看 小 说 读 报 151 40. 9 83.4 
唱歌 跳舞 41 11.1 2 
交 朋友 43 ii 23.8 
下 棋 打 牌 47 12.7 26.0 
Total responses 369 100.0 203.9 
Group 
三 、 上 机 实验 题 
1. 已 知 10 名 学 生 的 成 绩 调查 表 如 表 4 - 32 所 示 。 对 于 和 “ 男 ” 用 








“M" 表示 ,“ 女 ”用 “F” 表示 ， 对 于 “不 清 "“ 缺 考 ” RR ee 






































一 8” 表 示 
表 4-32 10 名 学 生 的 SS 

变量 标签 学 号 性 别 年 龄 赴 - 物理 化 学 英语 

变量 名 XH SEX YEAR xl x2 x3 xd 
1 01 女 六 上 82 90 88 77 
02 女 - sis 4 76 82 
3 03 7 r 20 90 56 
4 04 r 中 人》 20 89 76 
5 05 3 19 88 67 
6 OCI 7 男 2 76 80 
7 SC 女 2 : 98 91 
8 ~ 08 男 20 88 78 89 87 
9 09 女 21 67 67 58 99 
10 10 女 20 88 89 90 68 























(1) 试 按 要 求 进行 数据 录入 。 
(2) 在 04 号 学 生 后 插入 一 个 学 生 ， 编 写 他 的 考试 资料 并 输入 ; 删除 05 号 学 生 。 在 数 
学 成 绩 后 插入 语文 ， 编 写 这 门 课程 的 考试 成 绩 并 输入 ; 删除 英语 成 绩 。 


2. 某 大 学 一 年 级 部 分 学 生 的 期 末 考 试 成 绩 如 表 4 一 33 一 表 4 一 35 所 示 。 
表 4-33 某 大 学 一 年 级 部 分 学 生 的 期 未 成 绩 (一 ) 




















学 号 高 等 数学 计算 机 文化 基础 
0301 67 78 
0302 78 70 
0307 90 92 
0308 69 67 
0309 88 96 
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表 4-34 某 大 学 一 年 级 部 分 学 生 的 期 末 成 绩 (二 ) 

















学 号 大 学 英语 思想 品德 
0312 88 67 
0313 90 78 
0314 56 90 
0315 67 84 











表 4-35 某 大 学 一 年 级 部 分 学 生 的 期 末 成 绩 (三 ) 














学 号 大 学 英语 法 律  ， 思想 品德 

0301 70 90 / K 89 

0302 67 SS 99 
RN 

0303 78 p 和 RH- 92 

0304 80 ~ + 79 81 





民 - NN 
0305 65 p KN g 99 78 
0306 57 < 76 74 

















N YN 
0307 1 0 入 民 67 
> F 
0308 » X78 "Aar 80 
a 
0309 y A 88 9 Fr ”部 83 
SE hy 


0310 NM 90 下 外 71 66 
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(1) 将 表 4-33 中 的 数据 横向 合并 到 表 4 -35 中 ,将 表 4-34 中 的 数据 纵向 合并 到 
表 4-35 中 。 

(2) 将 表 4- 32 中 的 数据 分 性 别 对 数学 成 绩 进行 汇总 ， 并 分 别 计算 男生 和 女生 的 平均 

(3) 求 出 表 4- 32 中 10 名 学 生 4 门 课程 的 总 成 绩 ， 并 按 总 成 绩 进 行 升序 排序 。 

3. 某 市 场 调查 公司 发 出 60 份 调查 问卷 ,询问 顾客 对 某 宾 馆 的 服务 质量 的 评价 ， 回 答 
分 为 极 好 〈O)、 非 常 好 (V)、 好 (G)、 一 般 好 (A)、 差 (P) 等 级 别 ， 问卷 调查 结果 
如 下 : 























G07PAADP 
从 到 王将 
EA 


(1) 编制 频数 分 布 表 。 
(2) 绘制 条 形 图 。 
(3) 整理 顾客 关于 对 某 宾馆 服务 质量 的 回答 ,并 做 出 评价 。 
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4. 90 名 学 生 数 学 成 绩 如 下 。 

58 38 88 72 56 52 69 37 45 77 98 67 56 76 78 

89 60 56 89 90 67 99 80 73 67 89 50 44 66 78 

34 67 83 71 69 99 87 68 59 60 76 89 77 57 72 

50 78 98 67 50 67 99 89 91 84 64 89 78 94 88 

45 78 98 74 69 71 78 80 95 67 78 90 80 65 77 

68 72 90 98 78 69 95 89 78 74 72 69 87 81 80 
(1) 试 进行 分 组 。 
(2) 编制 频数 分 布 表 。 
(3) 输出 适当 的 统计 量 ， 如 最 高 分 、 最 低 分 、 平 均 分 、 分 位 数 、 中 位 数 和 众 数 等 。 
(4) 绘制 直方 图 ， 并 说 明 哪 些 分 数 附近 的 学 生 最 多 。 入 
(5) 绘制 条 形 图 ， 并 说 明 其 与 直方 图 的 差异 。 并 
(6) 将 这 组 数据 分 为 5 个 等 级 : 不 及 格 、 及 格 、 和 优秀 ， 绘 制 条 形 图 ， 编 

制 频数 分 布 表 。 

(7) 计算 90 个 同学 ett 
(8) 按 成 绩 总 分 进行 排序 ， 并 列 出 前 
二 ON 


A 销售 人 额 数据 (单位 : 万 元 


表 4-36 #4 



































(1) 根据 上 面 的 数据 进行 适当 分 组 。 

(2) 编制 频数 分 布 表 ， 并 计算 出 累计 频数 和 累计 频率 。 

6. 天 津 市 2010 年 市 天 津 市 内 各 区 县 总 人 口 如 表 4- 37 所 示 。 试 通过 绘制 饼 图 来 反映 
市 内 各 区 县 总 人 口 的 结构 。 


表 4-37 天 津 市 2010 年 市 内 各 区 县 总 人 口 数 



































地 区 和 平 区 河东 区 河西 区 南开 区 河北 区 红 桥 区 
总 人 口 /万 人 27. 35 86. 09 87. 06 101. 82 78. 84 53.15 
地 区 东 丽 区 西 青 区 津南 区 北辰 区 武 清 区 宝 抵 区 
总 人 口 / 万 人 57. 00 68. 47 59. 31 66. 90 94. 94 79.91 
地 区 滨海 新 区 宁 河 县 静海 县 萄 县 
总 人 口 /万 人 248. 21 41. 61 64. 70 78. 48 























资料 来 源 :《 天 津 市 2010 年 第 六 次 全 国人 口 普查 主要 数据 公报 》 


7. 表 4-38 给 出 了 2010 一 2014 年 我 国 国内 生产 总 值 数据 ( 按 当年 价格 计算 ) 
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表 4-38 2010 一 2014 年 我 国 国内 生产 总 值 数据 (单位 : 亿 元 ) 
年 份 国内 生产 总 值 第 一 产业 第 二 产业 第 三 产业 
2010 408903.0 39354.6 188804.9 180743.4 
2011 484123.5 46153.3 223390.3 214579.9 
2012 534123.0 50892.7 240200. 4 243030.0 
2013 588018.8 55321.7 256810.0 275887.0 
2014 636138.7 58336.1 271764.5 306038. 2 
要 求 : (1) 绘制 国内 生产 总 值 的 线形 图 。 





(2) 绘制 第 一 、 二 、 三 产业 国内 生产 总 值 的 线形 图 。 | 
(3) 根据 2014 年 国内 生产 总 值 及 其 构成 数据 绘制 饼 形 图 。 “上 
8. 下 面 是 一 份 问卷 中 的 一 道 复 选 题 : CN 























请 给 下 列 选 题 画 “V” AN 
A. 您 想 选 择 下 列 哪些 择偶 条 件 ，  、 NG 


1 一 相 狂 。 2 一 文化 水 平 。 /3 气质 风度 。 4 一 志同道合 
5 一 人 品 。 6 一 家 庭 条 件 “ 尺 XP- 个 人 收入 8 一 其 他 











Vv 





(1) 如 果 要 求 被 调查 者 每 人 每 演 可 以 从 备 选 答案 中 任 簿 选择 若干 项 ， 试 进行 多 选 问题 


的 分 解 ， 并 指明 所 采用 的 分 解 方法 。 Re 
(2) 如 果 规 定 被 调查 省 只 能 从 8 个 备 选 答案 中 选择 3 个 答案 ， 试 进行 多 选 问题 的 分 
解 ， 并 指明 所 采用 的 分 解 方法 。 下 必 
和 


(3) 针对 XD? 和 (2) 分 解 后 的 SPSS 变量 ， 分 别 建立 一 个 样本 容量 为 20 的 数据 文 
件 ， 并 进行 频数 分 析 。 


国 s 洲 回 


回 
【参考 答案 】 


第 


| «oD 


通过 本 章 的 学 习 ， 


世 


统计 假设 检验 


正确 理解 统计 推断 的 基本 理论 ， 掌 


,从 


全 
六 党 休 甸 煞 的 仇 设 抽验 的 基本 和 


序 及 SPSS 软件 的 操作 步骤 ， 学 会 利用 这 些 方法 解决 实际 折 中 的 问题 。 


| «SD 


NS 


知识 要 点 能 力 R 相关 知识 





假设 检验 的 基本 
思想 


、 
尼 久 于 冲 信 讼 从 汉 的 下 本 昌吉 
基本 步骤 .7 

人 中 


~ 


双边 检验 和 单 边 检验 、 夫 假设 和 备 择 
认证 | 失 验 统计 量 和 分 布 、 显 著 性 水 平 
么 和 和食 界 值 、 检 验 的 依据 和 两 类 错误 
婉 计 假设 检验 中 的 卫 值 





单 样本 均值 、 两 人 


独立 样本 均 人 对 
样本 均值 、 两 


样本 方差 的 检验 


| Ne 
从- 能 金字 所 均值 及 方 当 挫 难 的 全 本 
步骤 ,并 运用 这 些 方 活 解 决 实际 
问题 


零 假设 和 备 择 假设 、 检 验 统计 量 和 分 
布 、 显 著 性 水 平 a 和 临界 值 、 拒 绝 域 和 
统计 决策 





单 因素 方差 分 析 
(多 个 独立 样本 均值 
的 检验 ) 


能 够 掌握 单 因素 方差 分 析 的 基本 
步骤 ， 并 运用 它 解决 实际 问题 


零 假 设 和 备 择 假设 、 离 差 平 方 和 的 分 
解 、 检 验 统计 量 和 分 布 、 显 著 性 水 平 a 
和 临界 值 、 方 差分 析 表 和 统计 决策 





SPSS 软件 操作 





能 够 熟练 使 用 SPSS 软件 的 均值 检 
验 功 能 并 对 输出 结果 进行 正确 解读 





“One- Samples T Test” 对 话 框 、 

“Independent - Samples T Test” 对 
话 框 、“Paired - Samples T Test” 对 话 
框 、“*One- Way ANOVA” 对 话 框 





统计 假设 检验 是 统计 推断 学 的 重要 组 成 部 分 。 在 总 体 的 分 布 函数 完全 未 知 或 只 知 其 形式 、 
但 不 知 其 参 孝 的 情况 下 ,为 了 推断 总 体 的 某 些 性 质 ， 提 出 关于 总 体 的 假设 。 根 据 不同 的 前 提 条 
件 ， 有 多 种 检验 方法 。 本 章 结合 SPSS 统计 软件 ,介绍 常用 的 总 体 参 数 的 1 检验 和 下 检验 。 
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产品 是 否 符合 标准 


在 产品 质量 判断 与 管理 中 ， 抽 检 是 常见 的 方法 ， 尤 其 是 带 有 破坏 性 的 产品 检验 ， 如 炮弹 等 军工 产品 、 
热处理 后 零件 的 性 能 、 机 床 核心 组 装 件 的 强度 试验 、 电 子 管 的 寿命 试验 ， 等 等 。 抽 检 的 主要 矛盾 是 如 何 
实现 可 靠 性 和 经 济 性 的 统一 ， 也 就 是 要 寻求 既 保证 一 定 的 可 靠 性 又 使 检验 数量 最 少 的 抽检 方案 ， 抽 取 一 
定数 量 的 具有 代表 性 的 产品 ， 得 出 样本 数据 来 进行 分 析 ， 并 对 产品 整体 质量 来 进行 统计 推断 。 这 就 会 出 
现 两 个 问题 : 一 是 样本 的 特征 数量 能 否 反映 总 体 特征 ? 二 是 两 种 不 同 的 样本 参数 是 否 存在 差异 ? 

例如 ， 某 种 食品 红头 的 标准 规格 为 每 缮 净重 250g。 某 食品 厂 生产 出 一 批 这 样 的 访 头 ， 从 中 抽取 了 12 
钠 ， 它 们 的 数额 为 下 面 的 数据 (单位: g) ,人 


每 钠 的 净重 数据 如 下 人 K 
238.98 282.22 241.45 240.59 25 37. 26 


223,32 221.97 241. 56 KX < 265. 11 
该 食品 厂 想 知道 这 批 镶 头 是 否 符合 标准 。 SS- 
AN 


企业 在 进行 产品 质量 检查 时 都 会 遇 似 的 问题 。 企 业 需 要 通过 抽样 来 判断 批量 
产品 的 质量 是 否 达 标 ， 这 可 以 用 假设 检 法 做 出 推断 。 对 于 本 案例 ， 可 以 利用 所 取得 
的 样本 数据 ， 直 接 计 算出 样本 均值 X3242. 85， 总 体 均值 250 与 样本 均值 242. 85 的 差异 是 
Til 六 况 是 ,二 者 相 比 没有 什么 差 
别 ，7.15 的 差异 是 由 于 样 的 随机 性 造成 的 ， 另 另 二 种 入 况 是 ， 抽 样 的 随机 性 不 可 能 造成 























这 样 大 的 差异 ， 这 批 饶 头 | 4 冶 重 确实 碱 少 工 - 为 回答 这 个 问题 ， 我 们 可 以 采用 假设 检验 
的 方法 。 


NO ` 泡 
.PESEED 





培训 是 否 有 效果 


随 着 知识 经 济 时 代 的 到 来 ,企业 对 员工 的 素质 要 求 越 来 越 高 。 除 通过 人 才 市 场 、 猫 头 公司 、 网 络 媒 
体 物色 公司 发 展 的 合适 人 才 外 、 更 多 的 是 立足 企业 现 有 资源 ,试图 通过 教育 与 培训 达到 提高 员工 素质 要 
求 的 目的 以 期 实现 “人 尽 其 才 , 才 尽 其 能 ”"。 但 企业 在 花费 大 量 人 力 、 物 力 与 财力 后 ， 一 个 现实 而 又 敏 
感 的 问题 随 之 摆 在 众人 面前 ， 培 训 究 竟 为 企业 带 来 多 少 效益 ? 

例如 ， 某 企业 为 提高 产品 产量 ,决定 对 部 分 职工 进行 为 期 半年 的 培训 。 为 了 了 解 培训 效果 如 何 ， 将 
20 个 职工 分 成 两 组 ,每 组 10 人 ,两 组 分 别 为 未 经 过 培训 职工 和 经 过 培训 职工 ， 进 行 对 比试 验 ， 记录 当 
月 产量 ,如 表 5-1 所 示 。 


表 5-1 10 名 职工 当月 产量 (单位 : 件 ) 
未 经 过 培训 | 500 510 498 501 495 478 495 489 512 504 























经 过 培训 | 508 510 | 509 506 504 490 | 498 | 500 512 505 
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现 要 问 : 企业 培训 是 否 有 效果 ? 也 就 是 说 ， 培 训 是 否 能 提高 职工 的 月 产量 ? 


如 果 将 试验 方法 修改 为 : 对 同一 组 10 个 职工 ， 对 每 个 人 分 别 记录 其 培训 前 后 的 月 产量 ,做 对 比试 
验 ， 并 假设 试验 结果 仍 如 表 5-1 所 示 ， 此 时 结论 又 如 何 ? 


本 案例 给 出 了 企业 培训 试验 中 经 a 在 前 一 种 试验 方法 下 ， 由 于 是 对 
两 组 不 同 的 职工 分 别 进行 试验 ， 即 一 组 未 经 过 培训 ， 经 过 培训 ,因此 两 组 职工 的 月 产 
量 之 间 没 有 显著 影响 ,是 相互 独立 的 ， 故 称 为 “ i 。 表 5 -1 是 从 两 个 独立 总 
体 分 布 中 获得 的 两 组 样本 数据 ， 此 时 就 是 要 检验 两 个 独立 总 体 的 均值 之 间 是 否 存在 显著 差 
异 。 在 后 一 种 试验 下 ， 显然 对 同一 组 职工 的 培训 效果 进行 对 比试 验 ， 此 时 表 5 - 1 中 的 两 
组 数据 之 间 是 不 独立 的 ， 而 且 两 组 数据 之 间 是 一 一 对 应 的 ， 不 能 打 乱 顺序 ， 故 称 为 “配对 
样本 试验 ”。 对 于 这 类 “配对 样本 试验 "， 由 于 数据 的 不 独立 性 ， 就 必须 化 为 单个 总 体 的 数 
据 来 进行 检验 ， 对 同样 的 数据 ， 其 检验 结果 与 “独立 样本 试验 ” eT 用 错 方法 



























就 会 导致 错误 的 结论 ， RS 
六 次- 
.EEEEED NX 
ee nes 
教学 活动 是 一 项 千姿百态 、 极 富 创 i ， 它 离 不 开 教师 的 思考 、 探 索 和 创造 。 教 师 要 留心 于 
教学 的 方方面面 ， ep en 二 添 王 是 应 该 刚 除 的 粕 炸 ， 哪 些 东西 是 
值得 保留 的 “珍品 ”， 坚 些 地 方 是 人 的 领地 ， 从 而 天 类 审 有 所 发 现 ， 有 所 创造 。 在 教学 中 大 


胆 地 尝试 一 些 新 的 教学 方法 对 不 ye St 

例如 ， 一 位 教师 采 夺 引种 ， en Aastranersanan, 为 
此 随机 地 选取 了 水 平 往 沼 的 15 位 学 生 。 把 他 们 次 小 扩编 7 每 组 5 个人， 每 一 组 用 一 种 方法 教学 ， 一 段 时 
间 后 ， 这 位 教师 纷 儿 45| 位 学 生 进 行 统考 ， pe 











4 表 5-2 采用 不 同 教学 方法 的 学 生 统考 成 绩 表 (单位 : 分 
方 法 统考 成 绩 
Al (传统 教学 ) 75 62 71 58 73 
As (传统 教学 与 多 媒体 教学 结合 ) 81 85 68 92 90 
A (多 媒体 教学 ) 73 79 60 75 81 

















现 该 教师 希望 了 解 的 是 : 

(1) 不 同 的 教学 方法 是 否 对 提高 学 生 统考 成 绩 有 显著 影响 ? 
(2) 若 有 显著 影响 ， 哪 种 教学 方法 最 好 ? 

(3) 是 否 任意 两 种 教学 方法 的 效果 之 间 都 存在 显著 差异 ? 


掌握 以 上 信息 对 该 教师 制定 今后 的 最 佳 教学 方法 有 着 非常 重要 的 意义 。 在 本 案例 的 问 
题 中 ,所 研究 的 是 分 类 型 自 变量 (不同 的 教学 方法 ) 对 数值 型 因 变 量 (统考 成 绩 ) 的 影 
响 。 它 们 之 间 有 没有 关系 ”关系 的 强度 如 何 ? 所 采用 的 方法 就 是 通过 检验 各 总 体 的 均值 是 
否 有 显著 差异 来 判断 不 同 的 教学 方法 对 统考 成 绩 是 否 有 显著 影响 ， 这 就 是 方差 分 析 所 要 解 
决 的 问题 。 
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5.1 统计 假设 检验 的 基本 问题 


5.1.1 统计 假设 检验 的 基本 思想 


您 阅读 案例 5-1 


餐馆 促销 活动 的 真实 性 是 否 应 该 被 怀疑 ? 


有 一 家 本 地 的 饭馆 为 了 提高 午餐 时 间 的 生意 而 宣布 举行 一 次 活动 。 为 了 促销 ， 有 20% 的 机 打 餐 单 将 
会 根据 随机 的 原则 和 有 一 个 红星 ， 这 标志 着 这 一 额 午餐 是 免费 的 。 你 从 活动 扶 始 后 已 经 在 这 个 饭馆 里 就 
餐 了 4 次 ,但 仍然 没有 过 上 免费 午餐 。 sR 如 果 你 就 餐 8 次 后 仍然 
没有 过 上 免费 午餐 ， A 和 抱 恕 呢 ? 还 是 将 这 归于 坏 运 
气 呢 ? 

根据 概率 法 则 ， 你 每 次 就 餐 而 没 获 得 免费 午餐 的 机 站 ，4 次 午餐 都 没有 免费 午餐 的 概率 是 
《0. 8)4=0.410， 这 是 很 有 可 能 的 。 连 续 失败 8 次 的 人 0.168， 这 是 不 太 可 能 的 ， 但 仍然 很 
难 就 此 决定 要 向 消费 者 协会 进行 投诉 。 但 16 次 都 人 
称 的 20 吧 的 免费 午餐 机 会 是 真实 的 话 ， 其 概 人 RW ,8)15 0, 028。 

实际 上 ，16 次 失败 是 如 此 的 不 可 能 以 扫兴 你 应 该 怀 20%% 的 餐 单 上 有 幸运 二 红星 的 假设 的 真实 性 。 
这 里 仍然 有 很 小 的 概率 是 你 被 二 六 气 浪 儿 上 了 ， 但 社会 学 罕 X《 泪 不 相信 所 调 雇 见 的 ) 会 得 出 结论 
认为 20 吧 的 餐 单 上 有 幸运 红星 的 以 向 应 该 筱 拒绝。 we 

资料 来 源 ;[ 美 ] Jack Leyin,Jaries Alan Fox. 了 的 基础 统计 学 [MJ. 9 版 . 王卫东 , 译 . 
水 京 ， 中 国人 民 大 学 出 版 社 ，P008. 


、 
en rig 思 义 ， 就是 和 信和 例如 ， 求 方程 十 2 一 2 二 0 的 根 时 ， 





当 # 





由 直观 猜测 x 二 0.8， 它 究竟 是 不 是 该 方程 的 (近似 ) 根 (在 给 定 的 精度 内 )， 
可 以 将 z 一 0. 8 代入 该 方程 中 来 检验 判断)“ 假设 ”的 真 盆 。 
假设 检验 的 基本 思路 是 首先 对 总 体 参 数值 提出 假设 ， 然 后 后 肖 利 用 樟 本 提供 的 信息 才 洽 
证 先前 提出 的 假设 是 否 成 立 。 如 果 样 本 数据 不 能 够 充分 证 明和 支持 假设 的 成 立 ， 则 在 一 
的 概率 条 件 下 ， 应 拒绝 该 候 没 ， 相 反 ， 如 果 樟 本 数据 不 能 名 充分 证 明和 支持 假设 是 不 成 立 
的 ， 则 不 能 推翻 假设 成 立 的 合理 性 和 真实 性 。 上 述 假设 检验 推断 过 程 的 依据 是 小 概率 原 
理 ， 即 发 生 概率 很 小 的 事件 ， 在 一 次 实验 中 是 几乎 不 可 能 发 生 的 。 通 常 概率 要 多 大 才能 算 
rs 得 上 是 小 概率 呢 ? 假设 检验 把 这 个 小 概率 称 为 显著 性 水 平 ， 其 取 值 的 大 小 
3 与 我 们 能 否 做 出 正确 判断 有 着 相当 大 的 关系 。 然 而 ,a 的 取 值 并 没有 固定 的 
回 





标准 ， 只 能 根据 实际 需要 来 确定 。 一 般 地 ,a 取 0.05， 对 于 一 些 比较 严格 的 
情况 ， 它 可 以 取 0.01 或 者 更 小 。a 越 小 ， 所 做 出 的 拒绝 原 假设 判断 的 说 服 力 
就 越 强 。 

总 体 参 数 的 假设 检验 通常 包括 一 个 正 态 总 体 参 数 (均值 和 方差 ) 的 假设 检验 和 两 个 正 
态 总 体 参数 (均值 和 方差 ) 的 假设 检验 。 假设 检验 的 区 用 次 法 有 有 沈 梁 检验 ,好 和 枪 物 ， “等 
号 ”是 否 成 立 ) 和 单 边 检 验 〈 即 检验 “不 等 号 ”是 否 成 立 ) 。 

下 面 以 具体 实例 用 述 俱 设 检验 的 基本 原理 。 


【期 刊 推荐 】 
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【 例 5. 1〗 对 导入 案例 5 - 1 进行 假设 检验 。 

分 析 思 路 : 设 饶 头 每 饶 净 重 为 X，X 一 NGC， 于)， 吐 未知， 问题 是 根据 样本 判断 /一 
jw 三 250 还 是 yy 才 jw = 二 250。 为 此 ,我们 提出 假设 : 

Ho : 14 二 jo 二 250( 零 假设 ) 
Hi : jy 关 pw 二 250 ( 备 择 假设 ) 

由 于 要 检验 的 假设 涉及 总 体 均值 y 与 yo 是 否 有 显著 差异 ， 故 首先 想到 是 否 可 借助 样本 
均值 X 这 一 统计 量 来 进行 判断 。X 是 w 的 无 偏 估计 ，X 的 观察 值 的 大 小 在 一 定 程度 上 反 
映 了 7 的 大 小 。 因 此 若 X 与 wo 的 差异 不 大 ， 则 说 明 y 与 po 的 差异 不 大 。 

在 零 假设 Ho 成 立 的 情况 下 ,XX 与 yw 的 差异 | X 一 /6 | 应 较 小 ， 此 时 事件 “| XX 一 po | 较 
大 ” 则 为 小 概率 事件 ， 若 该 事件 发 生 了 ， 我们 就 怀疑 零 假设 Ho 的 正确 性 而 拒绝 Ho。 考 虑 


到 HH, 成 立时 ,< 本 大 ~ 一 D，S 为 样本 修正 方差， i 而 衡量 | 又 一 wm | 的 








ge 可 大 的 大 小 Bs 和 定 一 正 数 上 ， 使 当 观 测 
|X 


; Xp | > 上 Ho - 
值 亏 满足 a 就 拒绝 Ho。 AK 
车 给 定 一 个 较 小 的 数 a(0 二 a 二 1)， SE (5 一 1) 确定 : 
对 Fo >t]=e = 

区 SA 次 


Vy 
由 于 当 蕊 成 立时 ，T 一 TE, 由 分 和 人 的 定义 得 二 1 (1 一 1)。 


nn 


(5—-1) 





于 是 ， 当 P{ 人 一 “时 表明 、 
小 概率 事件 在 一 次 试验 让 居然 发 生 了 ， 这样 就 有 一 
说 修 设 二 问题 eg 

















理 
的 结论 ， 否则， 便 做 出 接受 零 假设 H, 的 结论 ， tan) Of tom-1) 
如 图 5.1 所 示 。 这 里 称 村 了 -二 从 为 检验 统计 最 ， 图 5.1 双边 检验 的 拒绝 域 








a 为 显著 性 水 平 , 土 1wz (n 一 1) 为 临界 点 ，| T| 宇 twzs (n 一 1) 为 拒绝 域 ， 
| 工 | 二 tz (n 一 1) 为 接受 域 。 


TG I TEE 


零 假设 的 内 涵 
零 假 设 含 有 “无 差别 ”的 意思 ,起源 于 对 肥料 和 药物 使 用 的 检验 。 首 先 假设 处 理 过 的 样本 与 未 处 理 
过 的 样本 不 存在 差别 。 零 假设 还 称 为 虚无 假设 、 原 假设 或 拟定 假设 。 备 择 假设 又 称 为 蔡 换 假设 、 对 立 
假设 。 


【 例 5. 1】 的 解 题 过 程 : 

第 一 步 : 提出 假设 : 
Ho :p= =250 
Hi:n 天 /po 一 250 
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第 二 步 : 选取 适当 的 检验 统计 量 ， 并 确定 出 检验 统计 量 的 分 布 。 


X—po 
S/Wn 

第 三 步 : 根据 样本 观测 值 计 算出 检验 统计 量 的 值 。 

计算 得 =242. 85，* 一 20. 80，" 一 12， 了 的 样本 观测 值 为 (一 从 一 人 

第 四 步 : 在 给 定 的 显著 性 水 平 a(0 二 a 二 1) 下 ， 查 所 选 检验 统计 量 服从 的 分 布 表 ， 确 
定 临界 值 。 

取 a==0.05， 则 查分 布 分 位 数 表 得 10.02 (11) 一 2.2010。 

第 五 步 : 确定 拒绝 域 并 做 出 统计 决策 。 

拒绝 域 为 | 工 | > 如 os (11)。 由 于 14| =1.19<2. 2010% 未 落 在 拒绝 城内 因此 
在 a=0.05 下 ， 接受 零 假设 H,， Sn 显著 差异 ,符合 质量 


标准 。 人 
加 二 5.1.2 po 


FF 


星人 (5—2) 


E19 


省 综 上 所 述 ， Se 下 的 步骤 ， 
【期 刊 推荐 ] (1) 根据 实际 问 提出 零 假设 H, 和 备 择 假设 Hi 。 
人 2) 根据 外 的 内 SN Re A 并 能 确定 出 检验 统计 量 


的 分 布 。 ,2 
(3) TT ,wT 


(4) 在 给 二 平 a(0<a<1) 下 + 选 检验 统计 量 服从 的 分 布 表 ,确定 临 
8 加 

界 值 。 “SS 
(5) 确定 并 做 出 拒绝 还 是 接受 记 的 统计 基 断 。 


@ 阅读 案例 5 一 2 


小 概率 原理 的 应 用 


小 概率 原理 是 人 们 在 长 期 的 实践 中 总 结 出 来 的 并 被 广泛 应 用 的 一 条 原理 ， 它 也 称 为 实际 推断 原理 。 
利用 小 概率 原理 对 事物 进行 推断 是 概率 性 质 的 反 证 法 .一 般 是 人 们 首先 提出 假设 ， 然 后 在 假设 之 下 ， 构 
造 一 个 达到 小 概率 标准 的 小 概率 事件 A， 最 后 做 出 鉴别 。 若 导致 不 合理 现象 出 现 ， 即 在 一 次 实验 中 小 概 
率 事件 A 居然 发 生 了 ， 则 拒绝 假设 ; 反之 则 接受 假设 。 

下 面 以 两 个 实例 说 明 小 概率 原理 在 实际 中 的 具体 应 用 

一 : 对 某 厂 的 产品 进行 质量 检查 ， 现 从 一 批 产品 中 重复 抽样 ， 共 取 200 件 样品 ， 结 果 发 现 其 中 
有 4 件 废品 ， 问 我 们 能 否 相 信 此 工厂 出 废品 的 概率 不 超过 0. 005? 

分 析 : 假设 此 工厂 出 记 品 的 概率 为 0.005， 一 件 产品 要 人 么 是 废品 ， 要 么 不 是 废品 ， 因 此 取 200 件 产 
品 来 观察 废品 数 相当 于 200 次 独立 重复 试验 ， 所 以 由 Bernoulli 概 型 可 知 ，200 件 产品 出 现 废品 的 概率 为 
P= 二 C4o00. 0054 X (1 一 0.005) 1% Az0.015。 根 据 小 概率 原理 ,我 们 可 以 认为 该 工厂 的 废品 率 不 超过 0. 005 
不 可 信 。 因 为 当 工厂 的 废品 率 为 0.005 时 ,检查 200 件 产品 出 现 4 件 废品 这 一 事件 是 一 个 小 概率 事件 ， 
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但 它 在 一 次 试验 中 竟然 发 生 了 ， 因 而 有 理由 怀疑 假定 的 合理 性 不 能 接受 假定 。 即 该 厂 的 废品 率 不 超过 
0.005 是 不 可 信 的 。 

实例 二 ， 某 工作 人 员 在 某 一 个 星期 里 ， 曾 经 接见 访问 者 12 次 ， 所 有 这 12 次 的 访问 恰巧 都 是 在 星期 
二 或 星期 四 。 试 求 该 事件 的 概率 。 是 否 可 断定 他 只 在 星期 二 或 星期 四 接见 访问 者 ? 若 12 次 访问 没有 一 次 
是 在 星期 日 ， 是 否 可 以 断言 星期 日 他 根本 不 会 客 ? 

分 析 假设 接见 具有 随机 性 ， 那么 12 次 接见 访问 者 都 在 星期 二 或 星期 四 的 概率 为 212/71? 一 
0, 0000003。 即 使 接见 可 以 是 一 星期 中 的 任意 两 天 ， 则 其 概率 也 只 有 C?212/17122 ， 这 个 数值 仍然 很 小 ， 因 
而 12 次 接见 全 部 集中 在 星期 二 和 星期 四 是 小 概率 事件 ， 而 现在 这 种 情况 竟然 发 生 了 ， 因 此 有 理由 认为 接 
见 访 问 的 日 子 是 有 规定 的 ， 只 在 星期 二 或 星期 四 进行 。 若 这 12 次 访问 没有 一 次 在 星期 日 ， 仍 假定 接见 具 
有 随机 性 ， 则 此 事件 的 概率 为 62317121/6A*0.0167。 这 不 是 小 概率 事件 ， 因 此 不 能 断言 他 在 星期 日 根 
本 不 会 客 。 

通过 以 上 对 小 概率 事件 的 分 析 可 知 ， 小 概率 事件 是 概率 论 中 一 个 虽 简 颇 有 实用 意义 的 原理 ,在 
日 常生 活 中 已 有 十 分 广泛 的 应 用 ， erie br eb 概率 论 的 精 

次 






情 ， 是 统计 学 存在 、 发 展 的 基础 ， 为 统计 推断 和 决策 提供 了 严格 的 狐 潮 食 据 。 对待 小 概率 
事件 ， 不 能 因为 它 发 生 的 可 能 性 很 小 而 忽视 它 ， 因 为 如 果 事 何 ， 小 概率 事件 六 旱 : 
必 会 发 生 ， 更 不 能 因此 而 惧怕 小 概率 事件 。 YX- 【期 刊 推荐 】 
资料 来 源 ， 段 向 阳 ， 刘 东南 . 浅 析 小 概率 事件 a ts, 2009(13): 255 -256. 
产 忆 区 


5.1.3 单 边 检验 \ 
NAN 


在 前 面 的 统计 假设 检验 原理 的 阐 坟 中， 我 们 所 针对 的 问题 是 检验 总 体 均值 /与 /是 和 
二 并 的 问题 《 昌 和 人 这 和 wo。 这 关头 是 “时 坟 ” 拓 由 有 个 
拒绝 域 、 两 个 临界 点 ， 每 不 拒绝 成 的 面积 是 a/2, 因此 称 这 类 检验 为 双边 检验 

在 另外 一 些 情况 汞 ， 栽 们 关心 的 假设 问题 囊 有 方向 性 。 有 两 种 情况 ， 一 种 是 我 们 所 考 
谍 的 数值 越 大 越 好 、 徊 莱 种 产品 的 产量 全 用 寿命 等 ， 另 一 种 是 数 信 越 小 超 好 ， 如 某 种 关 
品 的 废品 率 、 闪 这 襄 本 等 。 根 据 人 们 的 关注 点 不 同 ， 单 边 检 验 可 以 分 为 右边 检验 和 左边 
检验 。 

1. 单 边 检 验 与 双边 检验 的 不 同 之 处 


1) 所 提出 的 假设 不 同 

右边 检验 Ho :ypo， 再 :pm 

左边 检验 Ho :pm Hi :pp 。 

2) 拒 绝 域 不 同 

假设 总 体 X 一 NG 于 )，v 为 未 知 .X1 .XX2，,…. ,Xs 是 来 自 总 体 X 的 样本 ,给 定 显著 性 
水 平 i 

检验 :Ho :py 二 pwo， Hi:py 这 jw 时 ， 因 Ho 中 的 全 部 px 都 比 理 1 中 的 py 要 小 ， 当 厂 ! 为 真 时 ， 
观察 值 二 往往 偏 大 ， 因 此 拒绝 域 的 形式 为 T 全 > 当 Ho 为 真 时 ,车 的 观测 值 
t 宇 ts(n 一 1)， 则 拒绝 Ho。， 认 为 ypyo。， 如 图 5. 2 所 示 。 

类 似 地 ， 检验 Ho :pm ， Hi:p 二 pw 时 ,车 t 三 一 tn 一 1)， 则 拒绝 Ho， 认为 uy 二 po， 如 
图 5.3 所 示 。 
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1 
-taorD O 


图 5.2 右边 检验 的 拒绝 域 图 5.3 左边 检验 的 拒绝 域 


2. 单 边 假设 检验 的 注意 事项 

要 根据 研究 目的 来 建立 零 假设 和 备 择 假设 。 一 般 来 讲 ， 应 该 先 确定 备 择 假设 ， 再 确定 
零 假设 。 这 是 因为 备 择 假设 是 我 们 所 关心 的 ， 是 想 予 以 支持 或 证 实 的 ， 因 而 比较 清楚 ， 容 
易 确定 。 由 于 零 假设 与 备 择 假设 是 对 立 的 ， 只 要 确定 了 备 择 假设 , 零 假设 也 就 很 容易 确定 
出 来 。 .KAN 
1) 零 假设 ,对 应 大 梳 率 ， 备 择 假设 对 应 小 概率 “SN 
假设 检验 的 目的 是 希望 用 小 概率 的 事实 推翻 零 假设 记 代表 的 结论 , 而 在 没有 充分 证 据 
a 
一 问题 的 态度 ， 是 通过 设 轩 零 假设 和 备 摊 候 设 来 实现 ”通常 信 好 于 把 具有 很 大 把 所 成 立 的 
仿 设 定 为 零 假设 。 内 此 在 概率 分 配 上 , 零 假 攻 对 应 大 概率 ， 备 择 假设 1 对 应 小 概率 ， 

2) 零 假设 H, 一 定 要 设 为 “< 臣 “二 "， 相 应 的 备 择 假 设 Hi 要 设 为 “>” 或 
“二 "， 这 是 因为 我 们 实际 上 就 是 在 堆 假 设 本, 成 立 的 前 提 下 来 建立 理论 分 布 的 。 

3) 备 择 假设 1 的 方向 与 想 要 证 明 其 正确 性 的 力 向 一 数 

这 里 的 方向 是 指 备 择 假设 是 通过 定量 化 的 数学 表达 式 来 描述 检验 者 想 要 证 明 或 支持 的 
或 较 有 说 服 力 的 结论 人 因此， 必须 选择 好 恰当 的 符号 ,才能 使 备 择 候 设 描述 检验 者 的 真正 
意图 ， SO ye 

NN / 

5.1.4 统计 假设 检验 中 的 两 类 判断 错误 























统计 假设 检验 是 依据 样本 提供 的 信息 进行 判断 的 ， 也 就 是 由 部 分 来 推断 总 体 ， 因 而 假 
设 检 验 不 可 能 绝对 正确 ， 它 也 可 能 犯错 误 。 具体 情况 如 下 : 

1. 第 一 类 错误 

零 假设 Ho 本 是 真 的， 而 由 于 样本 的 随机 性 使 样本 统计 量 落 和 信 了 拒绝 域内 ， 因 而 做 出 
了 否定 Ho 的 判断 。 这 类 错误 称 为 第 一 类 错误 . 亦 称 为 弃 真 错误 。 在 管理 中 也 称 为 生产 者 
的 风险 度 ， 记 为 a。 其 大 小 为 





P{ 拒 绝 Ho| Ho 为 真 } 二 a 
2. 第 二 类 错误 
零 假设 Ho 本 来 不 真 ， 而 由 于 样本 的 随机 性 使 样本 统计 量 落 和 信 了 接受 域内 ,因而 做 出 
了 接受 HH, 的 判断 。 这 类 错误 称 为 第 二 类 错误 . 亦 称 为 取 伪 错误 。 在 管理 中 也 称 为 使 用 者 
的 风险 度 ， 记 为 8B。 其 大 小 为 : 
P{ 接 受 Ho | Ho 为 不 真 ;==B 
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国 国 国 败 国 朵 站 ee 


进行 统计 推断 要 冒犯 两 类 错误 的 风险 
我 们 永远 无 法 确定 对 于 零 假 设 是 否 做 出 了 错误 的 决定 ， 因 为 我 们 只 检验 了 样本 均值 之 
间 的 差异 ， 而 不 是 总 体 均值 之 间 的 差异 。 只 要 我 们 没有 掌握 实际 的 总 体 均值 ， 我 们 就 会 根 
据 我 们 所 做 的 决定 而 冒 着 犯 第 一 类 或 第 二 类 错误 的 风险 。 
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对 于 上 述 两 类 错误 ， 我 们 都 希望 尽量 减少 其 发 生 的 概率 。 但 对 于 一 定 的 样本 容量 ， 不 
能 同时 做 到 犯 这 两 类 错误 的 概率 都 很 小 。 如 果 减 小 犯 第 一 类 错误 的 可 能 性 ， 就 会 增 大 犯 第 
二 类 错误 的 机 会 ， 若 减 小 犯 第 二 类 错误 的 可 能 性 ， 也 会 增 大 犯 第 一 类 错误 的 机 会 。 一 般 来 
ee 国 » 
一 美 错误 作为 首要 的 控制 目标 。 若 起 希 望 犯 两 关 错误 的 可 能 性 帮 很 处， 解决 
的 只 一 办 法 是 增 大 样本 容量 。 然 而 ,实际 上 样本 容量 的 取得 量 有 限制 的 ， 只 











能 根据 实际 来 确定 。 ,| 【拓展 案例 】 
; NT-、 
Ko 阅读 案例 5-3 AR 
-人 YY 
逢 和 新 药 


、 ~ 

制药 公司 名 是 不 断 研究 新 药 。 坟 了 从 站 能 有 效 的 化 合 物 杰 尖 下 茹 于 各 化合物 ， 在 制药 行业 称 之 为 
“药物 筛选 "，Dunnrtt (1978) 认 洲 茹 物 途 选 法 在 计 决 策 问题 广 面 竹 处 于 初级 阶段 。 在 药物 解 选 中 ， 可 
能 会 有 两 种 行动 ，D “拒绝 啦 抽 种 药 勤 ， 季 选 另 一 种 苑 物 !\ 激 和 侍 “接受 ”这 种 药物 ， 这 种 情况 下 进行 
进一步 更 加 精细 的 试验 众 由 于 赋 究 者 的 目的 是 找到 黎 共 有 有 疗效 的 新 药 ， 所 以 统计 的 零 假设 和 备 择 
假设 应 取 如 下 形式 ,SA 

Ho ， 对 某 种 效 精 满 物 没有 疗效 六 ” 

Hi ， 对 某 种 兰 病 药物 具有 疗效 

Dunnrtt 解释 与 药物 筛选 过 程 关 联 的 可 能 错误 : “一 种 药物 实际 上 具有 疗效 却 被 放弃 〈 假 阴性 ， 对 应 
第 二 类 错误 )， 这 显然 是 令 人 不 快 的 事情 ， 其 中 总 存在 某 些 风险 。 另 外 ， 对 一 种 实际 上 没有 疗效 的 药物 却 
继续 进行 高 成 本 的 试验 〈 假 阳性 ， 对 应 第 一 类 错误 ) 浪费 了 时 间 和 人 金钱， 这 些 时 间 和 金钱 本 可 以 去 试验 
其 他 化 合 物 。” a 

在 以 上 两 类 错误 中 ， 哪 个 更 严重 ? 从 制药 公司 角度 而 言 ， 第 一 类 是 更 严重 的 错误 。 四 “ 国 起 既 回 
为 制药 公司 可 能 会 造成 时 间 和 人 金钱 的 无 谓 消耗 ;另外 ， 从 患者 的 角度 而 言 ， 第 二 类 错误 是 习 
更 严重 的 错误 。 因 为 此 药物 的 及 时 研发 可 能 会 挽救 无 数 患 者 的 生命 。 无 论 哪 种 情况 ， 计算” 国 于 
a 和 B， 评 估 假 设 检验 导出 的 推断 可 靠 性 是 重要 的 。 【期 刊 推荐 】 

资料 来 源 : Tanur, J.M., et al. eds. Statistics: AGuide to the Unkown. San Francisco: Holden — 
Day, 1978. 


5.1.5 统计 假设 检验 中 的 p 值 


在 前 面 阐述 的 统计 假设 检验 的 基本 原理 中 , 我们 是 通过 比较 1 统计 值 与 
临界 点 之 间 的 大 小 关系 ， 来 判断 拒绝 还 是 接受 零 假设 的 。 与 查 表 找 临 界 点 的 回 
一 个 等 价 判 别 方法 就 是 p 值 判别 法 .SPSS 统计 软件 使 用 的 就 是 这 种 判别 方法 。 【拓展 知识 】 
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1. 双边 检验 的 情形 


演 = 


由 前 面 所 介绍 的 + 检验 可 知 ， 在 零 假设 及 ,成 立 的 情况 下 ,统计 量 T= 7 





的 观测 值 


9 1， 车 一 k 二 tk， 则 接受 零 假 设 Ho。， 否 则 拒绝 Ho 。 
当 达 0,， 且 4 时 ， P(T>D)>$， 此 时 接受 Ho; 


p12 值 p12 值 
< 全 当 1>0, 且 1>k 时 , P(T>1) <$， 此 时 拒绝 Ho; 
下 地 ek 注意 到 + 点 外 侧 概 率 的 表达 式 为 PLT>/)。 显 然 , +=<0 的 情 


图 5.4 双边 检验 p 值 示意 图 形 ， 结 论 相似 。 总 之 ， 在 双边 检验 的 情形 下 ， 比 较 1 与 临界 点 人， 
与 比较 4 的 外 侧 概率 PCT>) 2 : 价 的 。 
为 方便 起 见 ， 我 们 定义 双边 检验 情况 下 检验 统计 量 的 2 统计 值 “外侧 ” 概 率 
的 两 倍 。 即 双边 检验 情况 下 ; 
检验 统计 量 的 p 值 = <" (5-3) 
称 检验 统计 量 的 p 值 为 统计 值 的 显著 性 概率 
据 此 ， 我 们 就 可 以 简单 地 用 /统计 值 的 最 AN 与 显著 性 水 平 a 比较， 
车 p<a， ee A 应 当 拒绝 H。， 接 受 Hi。 
车 p>a， Ee 应 
2. 单 边 检验 的 情形 人 
在 单 边 检 验 的 情况 下 ,出 i 已 己基 和 徊 / 凤 与 和 的 关系 (pm 或 w<m )， 
因此 ， 显 著 性 水 平 直 需要 分 成 两 半 ， ee 与 比较 1 的 外 侧 概 率 PCT>) 
Ty ~ 


ME 


图 5.5 右边 检验 p 值 示 意图 图 5.6 左边 检验 p 值 示意 图 








在 单 边 检验 的 情形 下 ， 统 计 值 的 显著 性 概率 p 值 仍然 定义 为 
检验 统计 量 的 p 值 =2P(T>7) (5—4) 
相应 的 判别 方法 是 : 
车 p/2 二 a， 则 表明 1 落 在 由 a 所 决定 的 临界 点 的 外 侧 ， 应 当 拒绝 再 , ， 接 受 Hi。 
车 b/2>x， 则 表明 上 落 在 由 a 所 决定 的 临界 点 的 内 侧 ， 应 接受 Ho 。 


OOO 


Pp 值 和 a 值 之 间 的 差异 
在 假设 检验 中 ,研究 者 要 事先 确定 显著 性 水 平 a 值 ， 这 个 选择 是 要 基于 牵涉 第 一 或 第 二 类 错误 的 权 
衡 。 或 简单 地 按照 惯例 ， 即 a 一 0.05。a 代表 着 我 们 能 允许 的 第 一 类 错误 的 可 能 性 。 与 之 相 比 ，p 值 就 是 


第 5 章 
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在 零 假 设 为 真 的 假设 下 ， 所 获得 的 样本 结果 比 实测 结果 更 为 极端 的 概率 ， 一 般 也 称 p 值 为 实测 显著 性 水 
平 。 它 表明 在 某 个 总 体 的 许多 样本 中 ， 某 一 类 数据 出 现 的 经 常 程度 。 或 者 说 ， 户 值 是 当 零 假设 成 立时 ， 
得 到 所 观测 数据 的 概率 。 如 果 这 个 概率 足够 小 ,我们 倾向 于 拒绝 零 假设 。 不 同 于 an 值 ， 它 是 由 数据 本 身 
所 确定 的 ， 是 来 自 于 检验 统计 量 的 计算 值 。 


您 阅读 察 例 5-4 
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戈 塞 特 与 ! 检验 
Re 


A 
总 塞 特 (William Sealey Gosset)， 英国 统计 学 家 ,出 生 于 英 py 特 伯 雷 市 ， 求 学 于 曼彻斯特 
学 院 和 牛津 大 学 ， 主 要 学 习 化 学 和 数学 。1899 年 ， ena 和 A. 吉 尼 斯 父子 酿酒 厂 ， 在 那里 
可 得 到 一 大 堆 有 关 酿 千 方 法、 原料 大 才 等 ) 特性 和 成 昌 的 关系 的 统计 数据 。 提 高 大 麦 质量 的 
重要 性 最 终 促使 他 研究 农田 试验 计划 ， 并 于 1904 年 气 戌 报告 《误差 法 则 应 用 》。 

义 塞 特 是 英国 现代 统计 方法 发 展 的 先驱 ， A 统计 学 4 检验 广泛 运用 于 小 样本 平均 数 之 间 的 
差别 测试 。 他 曾 在 伦敦 大 学 K. 皮尔 进 生 物 让 室 从 事 研究 (1906 一 1907)， 对 统计 理论 的 最 显著 
贡献 是 《平均 数 的 机 误 》 (1908) 。 这 篇 论 闫 阅 明 如果 是 小 样本 ， .那么 平均 数 比 例 对 其 标准 误差 的 分 
不 遵循 正 态 曲 线 。 由 于 吉 尼 斯 父 隆 本尊 1 区 因此 
义 塞 特 不 得 不 于 1908 年 首次 以 《学 华 5 (Studenb 为 笔名 % 兹 生生 物 计 量 学 ) 杂志 上 发 表 了 “平均 数 的 
概率 误差 ”。 AT 配 其 铬 的 平均 数 。 由 于 这 篇 文章 提供 了 “学 生 / 
检验 ”的 基础 ， 为 此 忆 称 多 统 针 学 家 把 1908 年 看 访 计 推断 理论 发 展 史 上 的 里 程 碑 。 后 来 ， 戈 塞 特 又 
连续 发 表 了 《相关 系 葡 的 娄 率 误差 》 (1909) 、( 牙 战 矣 招 样 的 样 水 平均 数 分 布 》(1909)、《 从 无 限 总 体 随 
机 抽样 平均 数 的 算 表 》(1917) 等 论文 。 估 在 这 些 论文 中 ， 第 一 ， 比 较 了 平均 误差 与 标准 误差 的 丙 
种 计算 方法 ;第 硅 ， 研 究 了 泊 松 分 布 应 用 中 的 样本 误差 问题 ; 第 三 ， 建 立 了 相关 系数 的 抽样 分 布 ;第 四 ， 
导入 了 “学 生 ” 分 布 ， 即 分布。 这 些 论文 的 完成 ， 为 “小 样本 理论 ” 黄 定 了 基础 ， 同时， 也 为 以 后 的 
样本 资料 的 统计 分 析 与 解释 开创 了 一 条 交 新 的 路 子 。 由 于 义 塞 特 开创 的 理论 使 统计 学 开始 由 大 样本 向 小 
样本 、 由 描述 向 推断 发 展 ， 因 此 ， 有 人 把 戈 塞 特 推 此 为 推断 统计 学 的 先驱 者 。 

资料 来 源 ， 中 华文 本 库 〈http: //www. chinadmd. com/file/vier36waotsie 6ivawpcxr36 - 1. html) 


5.2.1 单 样本 的 1 检验 


单 样本 检验 的 目的 是 利用 来 自 某 总 体 的 小 样本 数据 ， 推 断 该 总 体 的 均值 是 否 与 给 定 
的 检验 值 之 间 存 在 显著 差异 。 例 如 ， 想 要 了 解 某 大 学 本 科 生 高 等 数学 的 学 习 情况 ， 可 以 利 
去 年 高 等 数学 考试 的 成 绩 抽样 数据 ， 推 断 今年 高 等 数学 的 平均 成 绩 是 否 不 低 于 75 分 。 

设 总 体 X 一 NG o2 )，c2 未 知 ; XI ，Xz ，…，X, 是 来 自 总体 X 的 样本 ,与 S: 分 

别 为 样本 均值 和 样本 方差 。 给 定 显著 性 水 平 ， 检 验 参数 w。 

检验 步骤 如 下 : 

(1) 提出 假设 。 

© Ho :p=po, Hi:pApo 
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©® Ho :pp Hi:p<po 

图 Ho:p < po Hi:p > 

(2) 选择 检验 假设 Ho 的 统计 量 ， 并 确定 其 分 布 。 
_ Xp 
S/R 

(3) 根据 样本 观测 值 计算 出 该 统计 量 的 值 1。 

(4) 在 给 定 的 显著 性 水 平 a(0<a<1) 下 ， 查 所 选 统计 量 服从 的 分 布 表 ,确定 临 界 值 。 

(5) 确定 拒绝 域 并 做 出 判断 。 对 应 于 3 种 假设 的 拒绝 域 形式 分 别 如 下 : 

a 拒绝 域 为 | TT | 三 toz (1 一 1) 

@ 拒绝 域 为 T 委 一 (2 一 1) 。 


(a—1) (5 一 5) 








@ 拒绝 域 为 Tt。(n 一 1) 
注意 ， 对 于 大 样本 数据 ， 可 用 S? 代 蔡 2 ,采用 标准 正 i a 
【 例 5.2】 一 家 快餐 厅 出 售 富强 粉 花卷 ， 按 标准 每 个 的 平均 质量 应 该 是 75g， 市 


场 管 理 员 从 一 大 框 花卷 中 抽取 25 个 作为 一 | 算得 样本 均值 为 72g， 样 本 标 
准 差 为 8g。 在 显著 性 水 平 * 一 0. 05 下 ， 根 据 这 些 数据 该 管理 员 能 得 出 花卷 的 平均 质量 小 于 
75g 的 结论 吗 ? 假 nannies 





解 : (1) 提出 假设 Ho :p75， Hil: ES 
(2) 检验 假设 人 ~t(N—1)。 .~ 
S/n 


(3) 根据 样本 数据 : 7 rs¥8, n=25 如 计生 为 

72=45 5 1. 875 

Wh MR 

(4) 显著 性 水 平和 a 三 0.05， 在 表 知 一 oe 一 一 1. 7109。 

(5) 由 天 1. 875 二 一 1.7109， 所 也 拒绝 H,， 即 认为 每 个 花卷 的 平均 质量 是 降 





低 了 。 
5.2.2 两 个 独立 样本 的 上 检验 


两 个 独立 样本 检验 的 目的 是 利用 来 自 两 个 总 体 的 独立 样本 ,推断 两 个 总 体 的 均值 是 


否 存 在 显著 差异 。 例 如 ， 想 要 了 解 某 大 学 经 济 学 院 和 管理 学 院 本 科 生 高 等 数学 的 学 习 情 
况 ， 可 以 利用 去 年 高 等 数学 考试 的 成 绩 抽样 数据 ， 推 断 今 年 两 个 学 院 高 等 数学 的 平均 成 绩 
是 否 有 显著 差异 。 


Koes “5 


设 总 体 X~NCa, 有 FH)， 总体 Y~N(pw, 有 B), 久 与 Y 独立 且 一 未知。X1， 
，Xwm 是 来 自 总 体 X 的 样本 ,Yi ，Y。，…，Yw 是 来 自 总 体 Y 的 样本 ，X、Y 与 





Sf、 驻 分 别 为 两 样本 均值 和 样本 方差 。 给 定 显著 性 水 平 a， 检验 参数 ju 与 yo。 


检验 步骤 如 下 : 
(1) 提出 假设 
@@ Ho:m=p Hi: p Ap 
@Ho :1p Hi:m<ps 
图 Hu:mp Hi:p>p 
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(2) 选择 检验 假设 Ho, 的 统计 量 ,， 并 确定 其 分 布 


pe Ce 





式 中 ，Sw 2 1) S; 
(3) 根据 样本 观测 值 计算 出 该 统计 量 的 值 +。 
(4) 在 给 定 的 显著 性 水 平 a(0<a 二 1) 下 ， 查 所 选 统计 量 服从 的 分 布 表 ， 确 定 临 界 值 。 
(5) 确定 拒绝 域 并 做 出 判断 。 对 应 于 三 种 假设 的 拒绝 域 形式 分 别 如 下 : 
@ 拒绝 域 为 | TT | 之 twz (ni 十 nz 一 2)。 
@ 拒绝 域 为 T< 一 ts (ni 十 nz 一 2)。 记 
@ 拒绝 域 为 之 ts Gm 十 ns 一 2)。 除 
注意 ， 对 于 大 样本 数据 ， 可 用 中 代 蔡 中 ， 避 代 葵 肌 当 由 标准 正太 分布 统计 量 进行 
Z 检 验 。 A 
【 例 5.3】 对 导 和 案例 5- 2 进行 立 样本 县 骤 定 有 经 过 培训 和 经 过 培训 上 工人 月 
产量 分 别 近似 服从 正 态 分 布 NU , 只) 和 Neo 和 (一 0.05)。 
解 : (1) 提出 假设 ， B :mm 三/ ， ph MA 
(2) 检验 假设 ,的 统计 量 为 XO- 











式 中 ， 中 
Sw= 


2 
上 六 各 
ot 
10 


m=10, nz=10; z=498.2, y=504.2; s1=9.931, s2=6.613 
则 工 统计 其 的 值 为 





























gj 元 一 了 498. 2 一 504. 2 让 
区 /De /1 i 
WA nm 10 十 10 一 2 10 10 


(4) 由 显著 性 水 平 二 0.05， 查 表 知 一 to.0; (18) 一 一 1.7341 。 
(5) 由 于 :一 一 1. 59 之 一 1.7341， 所 以 接受 Ho ， 即 认为 培训 对 提高 职工 月 产量 无 显著 
影响 。 


5.2.3 两 个 配对 样本 的 上 检验 


两 个 配对 样本 的 1 检验 的 目的 是 利用 来 自 两 个 总 体 的 配对 样本 ,推断 两 个 总 体 的 均值 是 
否 存在 显著 差异 。 例 如 ， 想 要 了 解 某 大 学 本 科 生 高 等 数学 辅导 班 的 学 习 效果 ， 可 以 利用 辅导 
前 后 高 等 数学 考试 的 成 绩 配对 抽样 数据 ， 推 断 辅 导 前 后 的 高 等 数学 成 绩 是 否 有 显著 差异 。 

一 般 地 ， 设 有 nn 对 相互 独立 的 观测 结果 (Xi,Yi)，(Xz ,yz)，…，(X,Y)， 令 
Di=Xi Yi,D;=X; 一,…,D, 一 X, 一 Y，， 则 Di,D;,…,D, 相 互 独立 ，D;~N(pp op2)。 
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(1) 提出 假设 : 

© Ho :pp=0, Hi:ppA0 

© Ho:up 0, Hi:pp=<0 

图 Ho :up<0, Hi:pp>0 

(2) 选择 检验 假设 瓦 "的 统计 量 ， 并 确定 其 分 布 。 


一 (5—7) 





D 
TT 
(3) 根据 样本 观测 值 计算 出 该 统计 量 的 值 1。 
(4) 在 给 定 的 显著 性 水 平 a(0 二 a 二 1) 下 ， 查 所 选 统计 量 服从 的 分 布 表 ,确定 临界 值 。 
(5) 确定 拒绝 域 并 做 出 判断 。 对 应 于 3 种 假设 的 拒绝 域 形式 分 别 如 下 : 
© |TIZtw: (nz 一 1) 。 
4 了 伦 
@ Tn (nC—1), < 
【 例 5.4】 对 导入 案例 5 - 2 进行 配对 样本 检验 。 
解 : 本 题 中 的 数据 是 成 对 的 ， 即 对 同一 人 数据 。 现在 分 别 做 出 各 对 数据 的 
差 Di 二 Xi 一 Y;， 并 假设 Di 一 NOp， 吧 )。 pi 于 单 边 检 验 。 
(1) 提出 假设 ， Ho :p65 之 0, Hi: EK 
ls 


(2) 检验 候 设 ,的 统计 基 为 ， Ea 
\ Sp/Vn 


» 
(3) NN d= 一 Ri. 则 工 统计 量 的 值 1 = 
3 ~ 
d 
sr i st. 2 
(4) 由 显著 性 水 弟 w 三 0. 05， 查 表 知 志 in 181. 
(5) 由 和 DCF 966< 一 1 8331， 夺 以 撕 弛 ,本 认 为 培训 能 旨 训 职工 的 产量。 


5.2.4 ”两 个 独立 样本 的 下 检验 


两 个 独立 样本 的 下 检验 的 目的 是 利用 来 自 两 个 总 体 的 独立 样本 ， 推 断 两 个 总 体 的 方差 
是 否 存在 显著 差异 。 检 验 两 总 体 方差 是 否 存在 显著 差异 是 进行 两 独立 样本 上 检验 的 前 提 。 

设 总 体 X~NGu ,中 )， 总 体 了 ~NGe ,本 ) ,XX 与 了 独立 且 jn 与 jw 未 知 。X1，XX 
Xm 是 来 自 总 体 X 的 样本 ， Yi， Ya，…，Yz 是 来 自 总 体 Y 的 样本 ，S? 、 咏 分 别 为 两 样本 方 
差 。 给 定 显著 性 水 平 a， 检 验 参数 有 与 肥 。 

(1) 提出 假设 : 

@ Ho:0of =0;, Hi:o? #02 

加 Ho:nt>0:, Hi:o <o? 

图 Ho:o Sai, Hi:o? >0s 

(2) 选择 检验 假设 有 ,的 统计 量 , 并 确定 其 分 布 。 

-人 -Fo | (= 
(3) 据 样 本 观测 值 计 算出 该 统计 量 的 值 下 。 
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(4) 在 给 定 的 显著 性 水 平 a(0 二 a 二 1) 下 ， 查 所 选 统计 量 服从 的 分 布 表 ， 确定 临界 值 。 

(5) 确定 拒绝 域 并 做 出 判断 。 对 应 于 3 种 假设 的 拒绝 域 形式 分 别 为 

@ 拒绝 域 为 F 之 Fu (mm 一 1, nz 一 1) 或 FF 委 Pi- (mm 一 1， nz 一 1)。 

@ 拒绝 域 为 F<Fi-s(m 一 1, nz 一 1)。 

图 拒绝 域 为 FF, (ni 一 1, nz 一 1)。 

【 例 5.5】 某 外 资 公司 按 两 套 计划 对 新 招收 的 打字 员 进 行 培训 ， 这些 新 雇员 被 交替 分 
配 到 执行 不 同 训练 计划 的 两 个 组 ， 第 一 组 有 22 人 ， 第 二 组 有 25 人。 培训 结束 后 对 每 个 雇 
员 进行 考核 ， 假 定 考核 结果 都 服从 正 态 分 布 。 第 一 组 的 样本 方差 二 70. 3， 第 二 组 的 样本 
方差 号 一 225. 5。 该 公司 用 1 检验 法 来 检验 这 两 个 组 的 得 分 均值 是 否 有 显著 差异 ， 试 问 这 
些 数据 是 否 足 以 使 人 对 用 14 检验 所 必需 的 关于 方差 相等 的 假设 提出 怀疑 ? (a 二 0. 05) 

解 : (1) 提出 假设 Ho:0?=o2, Hl :0? 02。 KR 

(2) 检验 假设 昌 , 的 统计 量 为 


AN 
F- 昌 ~Fon RS 


(3) 根据 样本 数据 : m 二 22， i 
70. 3/222. 520, 316。 NN 
(4) 由 显著 性 水 平 一 Wu Fo.025 (21, .24) 2.27, Fo.975 (21，24) 一 
1/Fo.025 (24, 21)=1/1.75~0157% 2 
(86) 由 于 一 0, 3816 性 讽 线 -记忆 拒绝 各， sree 


ee 检验 的 简便 计算 


在 进行 独立 样本 的 方差 检验 时 ， 若 规定 检验 统计 量 














,sl>ss 
,一 较 大 的 样本 方差 _ | 32 
较 小 的 样本 方差 ”|Gz 
沁 , 若 Si>S? 


5 
则 拒绝 域 为 FF。 。 


5.3 单 因 素 方 差分 析 


在 实际 应 用 中 常常 要 探讨 不 同 实验 条 件 或 处 理 方法 对 结果 的 影响 。 通 常 是 比较 不 同 实 
验 条 件 下 总 体 均值 间 差异 。 方 差分 析 是 检验 多 个 总 体 均值 间 差异 是 否 显著 的 一 种 统计 方 
法 。 例 如 ， 体 育 科研 中 研究 训练 目标 、 方 法 和 不 同 运 动量 对 提高 某 项 运动 的 成 绩 的 影响 ， 
农业 研究 土壤 、 肥 料 、 日 照 时 间 等 因素 对 某 种 农作物 产量 的 影响 ， 等 等 。 方 差分 析 就 是 解 
决 这 类 问题 的 有 效 方法 。 
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您 阅读 案例 5-5 


英国 统计 学 家 及 遗传 学 家 费 希 尔 (R. A. Fisher) 与 方差 分 析 


现代 统计 学 的 主要 莫 基 者 之 一 ， 英国 统 计 学 家 和 遗传 学 家 费 希 尔 ，1890 年 2 月 17 日 生 于 伦敦 ，1912 
年 毕业 于 剑桥 大 学 数学 系 ， 后 随 英国 数理 统计 学 家 本 琼斯 进修 了 一 年 统计 力学 ，1918 年 任 罗 坦 斯 秦 农 
业 试 验 站 实验 室 主任 。1933 年 ， 因 为 在 生物 统计 和 遗传 学 研究 方面 成 绩 卓著 而 被 聘 为 伦敦 大 学 终生 教 
授 ; 1943 年 任 剑桥 大 学 遗传 学 教授 ; 1959 年 去 澳大利亚 ， 在 联邦 科学 和 工业 研究 组 织 的 数学 统计 部 做 研 
究 工作 。1962 年 7 月 29 日 座 于 澳大利亚 阿 德 莱 德 。 

费 希 尔 在 英国 的 农业 试验 站 工作 时 ， 从 田间 试验 设计 研究 入 手 ， 发 现 一 种 农作物 的 亩 产量 与 种 子 品 
种 、 播 种 量 、 农 药 等 多 种 因素 有 关 ， 为 从 统计 上 鉴别 各 因素 的 影响 程度 ， 了 方差 分 析 的 基本 原理 和 
方法 ,发 展 了 统计 试验 设计 的 基本 思想 。 试 验 设计 一 直 是 统计 学 中 一 er one 
业 、 医 疗 卫生 、 生 物 技 术 、 空 间 技术 等 许多 学 科 领 域 。 

ee 2009. 


5.3.1 方差 分 析 的 基本 概念 SNe 


方差 分 析 中 常用 的 术语 有 以 下 几 个 ,/ > 

(1) 实验 指标 ， Nema 用 大 写字 母 X、Y 等 表示 。 

(2) 实验 因素 ， 影响 实验 指标 的 4 条 件 称 为 因素 常用 天 写字 母 A、B、C 等 表示 。 

(3) 因素 水 平 ， 因 表 所 处 前 革 各 和 pod 常用 代表 该 因素 的 字母 加 下 
标 表示 ， 如 Al ,As ,As BB ,B 示 

(4) 方差 分 析 。 于 ne 若 仅 使 一 个 〈 或 一 个 以 上 ) 因素 发 生 
变化 ， ee 分 析 这 一 个 (或 一 个 以 上 ) 因素 





对 指标 的 影响 症 否 显著 ， 称 为 单 因 素 (或 乡 因 素 ) 方差 分 析 。 


‘ 


5.3.2 单 因素 方差 分 析 的 基本 原理 


1. 单 因素 方差 分 析 的 基本 思路 

【 例 5.6】 对 导入 案例 5 - 3 进行 方差 分 析 。 

分 析 思 路 : 此 例 中 ,统考 成 绩 为 实验 指标 ， 用 X 表示 ; 教学 方法 是 影响 统考 成 绩 的 因 
素 , 用 A 表示 ; 采用 3 种 不 同 的 教学 方法 可 看 成 3 个 因素 水 平 ， 用 Al 、As、As 表 示 。 为 
了 便于 分 析 ， 我 们 将 表 5 -2 中 的 数据 加 以 整理 得 表 5 - 3。 

表 5-3 学 生 统考 成 绩 整理 表 
































因素 水 平 统考 成 绩 合 计 水 平平 均 
Ai zl 一 75 | za 一 62 | zis=71 | mi=58 | zis=73 | x.=339 zl. 一 67.8 
A rn=81 | z=85 | zs 一 68 | za =92 | zs=90 | xz. =416 za. 一 83.2 
As ml 一 73 | za 一 79 | za 一 60 | rz 一 75 | rs 一 81 | zs. =368 za. 一 73.6 
舍 计 一 一 1123 元 一 74. 87 
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1) 提出 假设 
若 在 不 同 的 教学 方法 下 ， 统 考 成 绩 Xi 一 N(ui ,oz )(i 一 1,2,3)， 且 各 Xi 相互 独立 。 此 
例 即 检验 有 Ho :jp 三 入 二 6 是 否 成 立 。 因 此 ， 需 要 建立 假设 : 


Ho :和 一 记 二 入 一， 有 :Apa ,3 不 全 相等 


2) 平方 和 及 自由 度 的 分 解 
(1) 首先 对 总 误差 平方 和 进行 分 解 。 观 察 表 5 -2 中 的 数据 ， 我 们 不 难 发 现 : 


3 法 
@ 全 部 数据 之 间 存在 差异 。 其 差异 程度 用 St 一 》) 》) (x 一)? 来 表示 ， 称 为 总 误 


i=1j=1 


差 平方 和 。 这 部 分 差异 除了 包含 随机 波动 引起 的 误差 之 外 ， 还 应 包含 由 于 因素 人 的 不 同 水 
平 作用 所 产生 的 误差 。 
@ 在 同一 水 平 A; 下 ，5 个 观测 数据 之 间 存在 差异 。 其 差 和 = 


i=1 j=1 
来 表示 ， 称 为 关机 识 关 平方 和 《或 组 内 平方 和 ) .过 条 异 只 是 由 随机 误差 的 影响 引 
的 xy- 
@@ 不 水 平平 均 忆 (1 下 3) 到 这 和 从 异 ， 其 差异 程度 用 SA 一 六 
i=1j=1 
(5 一)? 米 表 示 ， 称 为 效应 平方 和 《让 平方 和 )。 这 部 分 差异 只 是 由 因素 效应 的 影响 
引起 的 。 NAN 2 


因为 sr 一 > 3 
中 


人 Tt — 二 .十 ( 杂 上 


NG ! 
3 5 3 5 
Ns (tj 一 元 .及 十 >) >) (元 .一 五) 十 2 六 De zn 


=1 j=1 i=1 j=! i=1j= 

















3 5 3 5 
DD (zj 一 五 .) (五 . 一 元 ) = > ) (元 . 一 元 ) > ) (zj 一 五 .) 一 0 
j=1 


所 以 Sr 一 Se 十 SA。 
(2) 其 次 对 自由 度 进行 分 解 。 根 据 自由 度 的 定义 可 知 : 
3 5 
@ 总 误差 平方 和 Sr = >) >) (zj 一 二 2?, 求 和 项 数 共 有 3X5=15 项 ,而 存在 


i=1j=1 


3 5 
> >) (zi 一 二 = 0, 因此 总 误差 平方 和 Sr 的 自由 度 订 王 15 一 1 一 14。 


i=1j=1 


3 5 
@ 随机 误差 平方 和 SE = >) >) (zj 一 坯 .)?, 求 和 项 数 共 有 3X5==15 项 ， 而 存在 


i=1j=1 


pe 一 云 .) 二 0(i 二 1,2,3), 因此 随机 误差 平方 和 St 的 自由 度 fe 二 15 一 3 二 12。 
j= 
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3 5 3 
@ 效应 误差 平方 和 SA 二 》)》) Gi. 一 z)?, 求 和 项 数 共 有 3 项 ， 而 存在 》) (5. 一 z) 一 0， 
il i=1 
此 效应 误差 平方 和 Sr 的 自由 度 fA 二 3 一 1==2。 
所 以 ft=fE 十 fA。 
3) 显著 性 检验 
由 误差 平方 和 的 分 解 公式 ， 我们 看 到 St 由 两 部 分 构成 ,一 部 分 是 Sg， 另 一 部 分 是 
Sa。 当 ST 一 定时 ，SE 与 SA 此 消 彼 长 。 若 Sa 大 ，SE 就 小 ， 表 明 St 主要 是 因素 的 不 同 水 平 
引起 的 ; 反之 , 车 SA 并 不 明显 大 于 Sg， 则 表明 不 同 水 平 对 Sr 没有 显著 影响 。 因 此 我 们 可 


以 用 SA 与 SE 的 比值 来 度量 因素 对 实验 指标 的 影响 程度 。 构 造 检验 统计 量 为 FA 一 






































5 
Fa /Ee), 拒绝 域 为 FF, (fA.fE).。 


对 于 给 定 的 显著 性 水 平 a(0 二 a 二 1)， ea II fe) 
时 ,拒绝 有 H,。 也 就 是 说 ， 当 组 间 的 差异 相对 于 组 内 
验 指标 的 影响 显著 ， 因 此 拒绝 H,。 


2， 单 因素 方差 分 析 的 一 般 计算 步骤 XS 
设 因 素 A 有 ;个 水 平 A1 .A “A Ai(i 二 1,2,…,s) 下 进行 n(n 宇 2) 次 独立 


a 和 六 | 


说 比较 大 时 ， 因 素 效 应 对 实 


实验 ,结果 如 表 5-4 所 示 。 























A， Za 2 区 zy 罗 EA zs 五 。 


合计 二 | 一 ov = Ts EE 





























其 中 ，xz; 表示 第 i 个 水 平 进行 第 j 次 实验 的 可 能 结果 (i=1,2,…,s;j 二 1,2,*…,n)。 


ri. = Ds (5—9) 
了 一 1 
本 于 
元 ep = 三 (5—10) 
z.. = > Ds (5-11) 
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假设 : 各 个 水 平 AiGi 一 1,2.…,s) 下 的 样本 Xi ,Xiz ,… ,XX 来 自 正 态 总 体 N (jp; ,oz) 


且 设 不 同 水 平 A; 下 的 样本 之 间 相互 独立 。 
1) 提出 假设 





Ho :pi =p =" =ps =p 
Hi:p ,pz2，… ,ps 不 全 相等 
2) 平方 和 及 自由 度 的 分 解 
(1) 总 误差 平方 和 “(Sum of Squares for Total) ， 简 记 为 Sr 。 它 是 全 部 观测 值 x; 与 总 
平均 值 亏 的 误差 平方 和 ， 反 映 了 全 部 观测 值 之 间 的 差异 程度 。 其 计算 公式 为 








2 


= Ha 六 > 局 到 (5-13) 
i=1j=1 i=1j=1 dd 
总 误差 平方 和 的 自由 度 fr=sXn—1 了 入 (5-14) 
(2) 随机 误差 平方 和 (Sum of Squares For Error)， NCS. 它 是 每 个 因素 水 平 内 
各 观测 值 x 与 其 组 内 水 平平 均值 z;. 的 误差 平方 和 ， 和 同一 因素 水 平 下 观测 值 之 间 的 
差异 程度 。 其 计算 公式 为 





NK 


二 ey (5-15) 
i967 = 并 


随机 误差 平方 和 的 自由 度 为 NS 


\E=sXn—s (5.=16》 

(3) 效应 误差 平方 和 (Suni Pares For Factor vie SA。 它 是 各 组 水 平平 均 

值 元 . 与 总 平均 值 亏 0 反映 Wve 的 冬 本 均值 之 间 的 差异 程度 。 其 计 
算 公 式 为 








人 KK Sg sa 训 
So -Sn ct fs = 入 ee (5-17) 
i 一 17 一 1 i=l 7 9 
We A 雄二 二 (5-18) 
总 误差 平方 和 与 随机 误差 平方 和 、 效 应 误差 平方 和 之 间 有 如 下 关系 : 
ST 一 SE 十 SA (5=19) 


总 误差 平方 和 的 自由 度 与 随机 误差 平方 和 的 自由 度 、 效 应 误差 平方 和 的 自由 度 之 间 有 
如 下 关系 : 











Bd Bink 《5 一 20) 
3) 假设 检验 问题 的 统计 量 及 拒绝 域 
检验 的 统计 量 的 形式 为 
Sa/fa_ SW 二 
= 好 F(fa,fe) (5—21) 
式 中 ，SA 为 效应 均 方差 .SE 为 随机 均 方差 。 
拒绝 域 的 形式 为 


FF.(fAsfe) 
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4) 列 出 单 因素 方差 分 析 表 ( 表 5 -5) 
表 5-5 单 因 素 方差 分 析 表 














误差 来 源 平方 和 自由 度 均 方差 F 比 临界 值 显著 性 
因素 A SA #5 SA 
误差 EE Se 一 Sr 一 SA 如 一 5 Se 六 BiG lm=8) 
总 和 工 Ee i 














5) 做 出 统计 决策 
若 检验 统计 量 的 观测 值 下 三 Fs(s 一 1，sn 一 s)， 则 拒绝 H。， 否 则 接受 Ho。 
一 般 地 ， 显 著 性 水 平 a 常 取 0.05 和 0.01。 ied sn 一 s)， 则 接受 Ho， 





认为 因素 A 对 实验 指标 的 影响 不 显著 ; 若 Fo.0 (5 一 1， ns)> Dy. os Gs 一 1,sn 一 s)， 则 
拒绝 本 ， 认 为 因素 A 对 实验 指标 的 影响 一 人 F >Fo.o01(s—1,sn—s) 
2 也 拒绝 H，。， 认 为 因素 A 对 实验 指标 的 影 别 显著 。 
章 妆 衣 需要 说 明 的 是 ， ,ie 
【期 刊 推荐 】 ”观测 值 的 个 数 相等 的 情况 下 进 得 的 实际 问题 中 ， 对 于 每 个 因素 水 平 下 观 








Rd ee 


辐 凡 国 回 网 的 





nn 








NA 
ii 
WOS 

-\ 方差 分 析 的 实证 WX 
ra 而 是 分 用 训 y 和 度量 玫 据 的 克 民 ， 正如 Snedecor 所 
WA CO 种 技巧 "。 
NA ee 

假设 检验 可 个 总 体 的 均值 检验 。 对 于 多 个 总 体 ， 主 要 运用 方差 分 析 。 假 定 现 有 4 个 总 体 均值 分 
别 为 jn、jw、p8、 JU4， 如 果 用 一 般 假 设 检验 的 方法 (如 4 检验 )， 一 次 只 能 研究 两 个 样本 ， 要 检验 4 个 总 体 
的 均值 是 否 相等 ， 则 需要 做 6 次 检验 检验 I，Ho :pu 二 po; 检验 有 ，Ho :p= 二 pa; 检验 硅 ，Ho :p= 二 pw; 检 
验 信 ，Ho :pw 三 pa; 检验 V，Ho :pw 二 pu ; 检验 和 ，Ho :pv 三 pu )。 很 显然 ， 做 这 样 两 两 的 检验 十 分 烦琐 。 而 
且 ， 每 次 检验 两 个 的 做 法 共 需 要 进行 6 次 不 同 的 试验 。 如 果 a 二 0.05， 每 次 检验 犯 第 一 类 错误 的 概率 相应 地 
增加 。 做 6 次 检验 会 使 犯 第 一 类 错误 的 概率 达到 1 一 (1 一 a)5s0.265， 而 置信 水 平 则 会 降低 到 0.955 
0.735。 因 此 ， 对 于 多 个 总 体 来 说 ， 随 着 增加 个 体 显著 性 检验 的 次 数 ， 偶 然 因素 导致 差别 的 可 能 性 也 会 增加 
(并 非 均值 存在 的 差异 ) ， 而 方差 分 析 同 时 考虑 所 有 的 样本 ， 从 而 排出 了 累积 错误 的 概率 ,避免 拒 绝 一 个 真 
实 的 零 假设 ,提供 了 检验 效率 。 





例 5.6 的 解 题 过 程 
(1) 分 析 不 同 的 教学 方法 对 提高 学 生 统 考 成 绩 是 否 有 显著 影响 。 
第 一 步 : 提出 假设 : 
:和 二 Ap 一 As 一 人 
Hi :pu pa ,pi 不 全 相等 
第 二 步 : 构造 检验 统计 量 及 其 分 布 : 


第 5 章 
统计 假设 检验 | 163 


SA， Sk 


Cn FC 1,sn—s) 


F 
第 三 步 : 计算 误差 平方 和 


3 5 3 5 2 
ST = 六 > Gj —7): = DD Das = 1457. 733 
i=1 

















TZ ~ 604. 993 





SE = St— SA = 852. 800 
第 四 步 :， 列 出 方差 分 析 表 ， 如 表 5 -6 所 示 。 
表 5-6 方差 分 析 表 














方差 来 源 平方 和 自由 度 均 方差 显著 性 
因素 A 604. 993 2 302. 467 
误差 下 852. 800 12 71. 067 
总 合 T 1457. 733 14 Ne @ 

















第 五 步 : 做 出 统计 决策 。 

(1) 计算 知 统计 量 取 值 F=4. sf Fo.os = (2,12)=3.89, Fo.o (2,12)= 
6.93。 由 于 Fo.05 (2,12)<F<Fo )， 因此 拒绝 Hox 就 是 说 我 们 认为 3 种 不 同 的 
教学 方法 对 统考 成 绩 的 及 响 是 二 了 

(2) 分 析 哪 种 教学 方 A A Dn 的 点 估计 去 ; 来 确定 。z 一 
67.8, Zz,=83.2, 3)67 Ws 统 教学 相 结合 的 方 法 效果 最 好 ， 党 
生 的 和 二 考 吉 给 ed 2 分 。 * 放 

(3) 分 意 丙 种 教学 方法 的 效果 之 癌症 天 部 存 在 显著 差 异 ， 对 于 此 问题 ， 可 以 通过 
对 各 ;进行 两 两 单 边 4 检验 的 方法 进行 分 析 。 

首先 检验 pn 与 yo: 

Ho:pm=p, Hi: pe 

1+|==| 一 2. 856| 二 2. 856 这 to.025 (8) 二 2.3060， 拒绝 Ho, 说 明 第 一 种 与 第 二 种 教学 方 
法 之 间 差 异 显 著 。 

其 次 检验 yw 与 ys: 

Ho:p2=p3» Hi:psF ps 


It 二 11.705|==1.705 过 to.025 (8) 二 2.3060， 接受 Ho, 说 明 第 二 种 与 第 三 种 教学 方法 
之 间 差 异 不 显著 。 
最 后 检验 ja 与 ps : 
Ho:m=p3, Hi:pA ps 
lt==| 一 1. 1721==1. 172 过 to.025 (8) 二 2.3060， 接受 Ho, 说 明 第 一 种 与 第 三 种 教学 方 
法 之 间 差 异 不 显著 。 
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5.4 用 SPSS 统计 软件 进行 统计 假设 检验 


5.4.1 One-Samples T Test 过 程 


(1) 选择 “Analyze 一 Compare Means 一 One--SampleT Test...” 选 项， 弹出 “One- 
Sample T Test” 对 话 框 。 

(2) 将 需要 检验 的 变量 从 左 侧 列表 框 通过 中 间 的 移动 按钮 选 入 到 右 侧 的 “Test Varia- 
bles” 列 表 框 中 。 

(3) 在 “Test Value” 文 本 框 内 输入 已 知 的 总 平均 数 ， 默认 值 为 0。 

(4) 单 击 “Options. .. ”按钮 ， 弹 出 “One ~ Sample T Tes' St KOWtions” 对 话 框 ， 用 于 
定义 相关 的 选项 ， 有 : A \ 

Oz 在 Confidence Interval Percentage: 框 内 输入 团 信 概率 ， 默认 为 95%% 。 

四 Missing Values 选项 组 : 指定 对 缺失 值 的 处 理 方 趟 ， 包含 两 个 单 选 按钮 。 

回 a. Exclude cases analysis bx anaiysis 单 选 按钮 : 剔除 本 计算 变量 含有 缺 
这 站 拓 值 的 数据 。 EAIN 
男 b. Exclude cases Na : 单 选 按钮 : 吻 除 所 有 计算 变量 含有 缺失 值 的 
【拓展 视频 】 ”数据 。 MSN XXX 
@ 单 击 Coden 按钮 ， 返回 到 0 纺 - Sample T Test” 对 话 框 。 

(5) 单 击 “OK” 按 乌 ， _ 肥 末 完 成 音 样本 均 入 检验 的 所 作 ， 

【 例 5.7】 用 SBSS 统计 软件 求解 例 531。 

解 :提出 假设 :pp 一 250，H1 汶 才 jn so: 

调用 SPSS 统 讲 软件 的 One - Sample T Test 功能 ， 则 输出 结果 如 表 5- 7(a) 和 表 5 一 7(b) 
所 示 。 


















表 5-7(a) 描述 统计 表 (One - Sample Statistics) 





N Mean Std. Deviation Std. Error Mean 





每 缸 净 重 12 242. 8508 20. 79799 6. 00386 














表 5-7(a) 说 明 : 第 2 列 是 样本 数 ; 第 3 列 是 样本 均值 ; 第 4 列 是 样本 标准 差 ; 第 5 
列 是 样本 均值 标准 误差 | 关 即 ,统计 量 的 分 母 部 分 。 

由 表 5-7(a) 可 知 ，12 个 样本 的 一 次 平均 铅 头 净重 数额 为 242.85g， 标 准 差 为 
20. 79799g， 均 值 标准 误差 为 6. 00386 。 

表 5-7(b) 说 明 : 第 2 列 是 1 统计 量 的 观测 值 ; 第 3 列 是 自由 度 ; 第 4 列 是 :统计 量 
的 观测 值 的 双边 概率 p 值 ; 第 5 列 是 样本 均值 与 检验 值 的 差 ， 即 上 统计 量 的 分 子 部 分 ;第 
6、7 列 是 样本 均值 与 总 体 均值 差 的 95% 的 置信 区 间 。 

由 表 5-7 (b) 可 知 . t 统 计量 的 观测 值 为 一 1. 191， 自 由 度 是 11,t 统计 值 的 显著 性 
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概率 p 值 等 于 0.259， 大 于 a 二 0.05， 因此 不 应 拒绝 零 假设 H,， 认 为 该 批 钢 头 符合 标准 。 
总 体 均 值 y 的 95% 的 置信 区 间 (250. 6364，256. 0652) 包括 0， 由 此 也 证 实 了 上 述 推 断 。 


表 5-7(b) 单 样 本 t 检 验 表 (One -Sample Test) 
































Test Value=250 
95% Confidence 
Sig. Mean Interval of the 
t df 
(2 — tailed) Difference Difference 
Lower Upper 
每 鲍 净 重 eh 11 .259 一 7.14917 一 20. 3636 6. 0652 





KR 


(1) 选择 “Analyze 一 Compare ar T Test... ”选项 ， 弹 
出 “Independent - Samples T Test” 对 话 框 。 

(2) 人 和风 且 是 估 生 合作 家 全， ye i 先 人 到 右 侧 的 “Test Varia- 
ble(s)” 列 表 框 中 。 

(3) 将 分 组 变量 从 左 侧 列表 框 通过 汕 可 的 移动 按钮 选 入 到 右 侧 的 Grouping Variable 
列表 框 中 。 tN XXX 

(4) 单 击 “Define Groups L , 按 钥 ， 弹出 “ “Define Grub 对 话 框 ， 包 含 两 个 单 选 按钮 。 

QD Use specified values 站 单 揭 按 钮 ， 用 于 ER 在 “Group 1:” 和 “Group 2:” 文 
本 框 中 分 别 输入 分 组 变量 的 值 (如 1 和 2) 。 

@ Cut point 昔 选 按钮 ; 用 于 连续 变 居 X 在 框 内 输入 -个 值 作为 分 割 值 ， 将 数据 分 为 
两 组 。 NANY 

图 单 击 “Continue” 按 钮 返回 到 “Independent - Samples T Test” 对 话 框 。 

(5) 单 击 “Options. .. ”按钮 ， 弹 出 “Independent - Samples T Test:， Options” 对 话 
框 ， 其 内 容 设置 与 “One - Samples T Test” 完 全 相同 ， 此 处 不 再 重复 。 

(6) 单 击 “OK” 按 钮 ， 即 可 完成 独立 样本 均值 检验 的 操作 。 


EY TY TO 


独立 样本 :检验 在 建立 数据 文件 时 的 注意 事项 
在 建立 独立 样本 上 检验 的 数据 文件 时 ， 要 定义 两 个 变量 ， 一 个 是 检验 变量 ， 按 师 序 输入 两 个 独立 样 
本 的 全 部 数据 ; 另 一 个 是 分 组 变量 ， 如 用 “1” 代 表 第 一 个 样本 ， 用 “2” 代 表 第 二 个 样本 ， 则 对 应 第 一 
个 样本 数据 全 部 输入 1， 对 应 第 二 个 样本 的 全 部 数据 对 应 输入 2 


【 例 5.8】 用 SPSS 统计 软件 求解 导入 案例 5- 2 的 前 一 种 实验 。 回 和 回 
解 : 提出 假设 Ho :p==po， Hi :和 天 re 。 > 5 
调用 SPSS 统计 软件 的 Independent - Samples T Test 功能 ， 则 输出 结 回忆 

如 表 5-8(a) 和 表 5-8(b) 所 示 。 【拓展 视频 】 


5.4.2 Independent - Samples T Test 过 程 
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表 5-8(a) 描述 统计 (Group Statistics) 











组 别 N Mean Std. Deviation Std. Error Mean 
未 培训 10 498. 20 9. 931 3.140 
月 产量 
培训 10 504. 20 6. 613 2.091 




















表 5-8 (a) 是 两 组 职工 月 产量 的 基本 描述 量 。 可 以 看 出 两 组 职工 月 产量 的 样本 平均 
值 有 一 定 差异 ， 这 种 差异 是 否 显著 需要 通过 以 下 检验 完成 。 


表 5-8(b) 两 独立 样本 1 检验 表 (Independent Samples Test) 





Levene's 


Wie ttest for Equality of Mea 
a or ns 
Equality of / » o 
, 
Variances NAN 


O NE 95% Confidence 


lean Std. Error | Interval of the 


/ 
F Si b df Sh NS 
ee Difference | Difference Difference 














@ ® @ 
NA - L U 
JS ee OWer pper 
NA XA 
Equal WA 2 
variances .874 | .362 bs lx59 18 .129 (于 67000 78 一 13.927| 1. 927 
月 | assumed XX WA 
sp 外 < YY 
最 | 4 ba 
“ | 从 
VariancesSN\ > —1.59|15.670| /2 132 一 6.000 3.773 | 一 14.012| 2. 012 
not assumed 
































表 5-8 (b) 结果 解释 : 对 两 组 职工 月 产量 的 检验 ， 是 分 两 步 来 进行 的 。 

第 一 步 : 方差 齐 性 检验 ， 即 两 总 体 方差 是 否 相 等 的 下 检验 (第 四、 图 列 )。 己 值 为 
0. 874， 对 应 的 统计 值 的 显著 性 概率 值 p= 二 0.362。 如 a 二 0.05， 由 于 概率 p 记 0.05， 可 认 
为 两 总 体 方差 无 显著 差异 。 

第 二 步 : 两 总 体 均值 的 检验 〈 第 田 、@、@ 列 ) . 

由 于 两 总 体 方 差 无 显著 差异 ， 因 此 应 看 Equal Variances assumed (假设 方差 相等 ) 的 
L 检验 的 结果 。 工 统计 量 的 观测 值 为 :一 一 1. 59， 对 应 的 统计 值 的 显著 性 概率 值 2 一 0. 129 二 
a 一 0.05， 因 此 认为 两 总 体 的 均值 无 显著 差异 ， 即 培训 对 提高 职工 月 产量 没有 显著 效果 。 
车 两 总 体 方差 有 显著 差异 ， 则 应 看 Equal Variances not assumed (假设 方差 不 相等 ) 的 1 
检验 的 结果 。 

表 5-8 (b) 中 的 第 四 列 (Mean Difference) 和 第 @ 列 (Std，Error Difference) 分 别 
是 :统计 量 的 分 子 和 分 母 ， 第 @ 回 列 为 两 总 体 均值 差 的 95 癌 的 置信 区 间 的 下 限 和 上 限 。 由 于 
0 包含 在 该 由 信 区 间 内 ， 因 此 也 从 另 一 个 角度 证 实 了 上 述 推断 。 
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5.4.3 Paired - Samples T Test 过 程 


功能 实际 上 是 和 “One - Samples T Test” 过 程 相 重复 的 〈 等 价 于 已 知 总 体 均 数 为 0 
的 情况 ) 。 

(1) 选择 “Analyze 一 Compare Means 一 Paired - Samples T Test. ..”， 弹 出 “Paired - 
Samples T Test. .. ”对 话 框 。 

(2) 从 左 侧 列 表 框 中 同时 先 中 两 个 成 对 变量 ， 通 过 中 间 的 移动 按钮 将 其 移 人 到 右 侧 的 
Paired Variables 列表 框 内 。 

(3) Current Selections 项 ， 显 示 被 选中 的 成 对 变量 

(4) 单 击 “Options... ”按钮 ， 弹 出 “Paired - idles T Test: Options” 对 话 框 ， 
其 内 容 设置 与 One - Samples T Test 完全 相同 ， 此 处 不 再 重复 。; 

(5) 单 击 “OK” 按 钮 ， 即 可 完成 配对 样本 均值 检验 的 操作 。 

【 例 5.9】 用 SPSS 统计 软件 求解 导入 案例 5-2 的 后 种 实 验 ， Ee 

解 : 提出 假设 Ho :pw 宇 0. Hi :pp 二 0。 } 【拓展 视频 】 

调用 SPSS 统计 软件 的 Paired - Samples 工 Tekt 功能 ， 则 输出 结果 如 
表 5-9(a)、 表 5-9(b) 和 表 5-9(c) 所 示人 入 \ 








表 5-9(a) 描述 统计 表 paired Samples Statistics) 











Me SN NIN Std. Deviation Std. Error Mean 
Se、 
Pair 1 ”未 经 过 培训 .498. 50 10 ,OP 3. 140 
经 过 培训 。 “504. 20 10 XL 6 613 2.091 














表 5-9(a) 表明 加 江 培训 后 较 培 训 交 的 并 区 号 最 有 明 显 增长 。 这 种 增长 是 否 显著 需 
要 通过 以 检验 完成 > 


、 案 5-9(b) 简单 相关 系数 及 检验 (Paired Samples Correlations) 


Dy 







Correlation 





Pair 1 未 经 过 培训 &- 经 过 培训 .910 . 000 








表 5-9(b) 表明 ， 职 工 培训 前 后 平均 产量 的 简单 相关 系数 达到 0. 910， 对 应 的 统计 值 
的 显著 性 概率 值 p= 二 0.000 二 a 二 0.05， 说 明 二 者 有 显著 的 正 线性 相关 关系 。 


表 5-9(c) 两 配对 样本 t 检 验 (Paired Samples Test) 





Paired Differences 





95% Confidence 


Si 
Sta Sl Interval of the t df 2 
Mean Error (2 一 tailed) 
Deviation Difference 
Mean 





Lower Upper 





未 经 过 培训 
Pair 1 、 | 一 6.000| 4.784 | 1.513 | 一 9.422 | 一 2. 578 | —3.966 9 .003 
一 经 过 培训 
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表 5-9(c) 表明 ,由 于 + 统计 值 的 显著 性 概率 值 p= 二 0.003， 而 p/2 二 0.0015 二 a 二 
05， 因 此 拒绝 H，。， 接 受 互 ! ， 即 认为 培训 后 较 培训 前 职工 的 平均 月 产量 有 显著 增长 。 


5.4.4 One- Way ANOVA 过 程 


(1) 选择 “Analyze-Compare means-One- Way ANOVA...” 选 项， 弹出 “One 一 
Way ANOVA” 对 话 框 。 

(2) 从 左 侧 列表 框 中 选择 观测 变量 (指标 )， 通 过 中 间 的 移动 按钮 移入 到 右 侧 的 
“Dependent List” 列 表 框 内 。 

(3) 从 左 侧 列表 框 中 选择 因素 变量 ,通过 中 间 的 移动 按钮 移入 到 右 侧 的 “Factor” 列 
表 框 内 。 

(4) 依次 单 击 “Contrasts... ”按钮 和 “Post Hoc. . ” 琅 乌 ， 弹出 “One - Way 
ANOVA : Contrasts 对 话 框 和 One-Way ANOVA: Post Oe Mlble Comparisions” 对 
Bi De 也 较 少 用 ， 此 处 略 。 入 N 

5) 单 击 “Options. .. ”按钮 ， 弹 出 “One-- WayiANOVA， Options” 对 话 框 。 

Statistics 项 ， 选中 ， 人 复 选 栓 ; 站 输出 基本 描述 统计 量 ， 其 他 选项 略 。 

@ Missing Values 项 : 定义 欠 全 有 让 通 方式 其 内 容 设置 与 “One - Samples 了 
Test” 完 全 相同 ， 此 处 不 再 重复 。 

加 单 击 “Continue” 按 钮 ， a Way ANOVA” 对 话 框 。 

(6) 单 击 “OK” 按钮 ， 即 可 党 以 单 因 家 方差 人 分 析 的 操作 


晨 , 【 例 5. 10】 用 SPSS 统计 软件 求解 避 和 案例 5 B= 





解 : 担负 假设 ，Ho :pn 一 所 六 区 村 im， ja， 加 不 全 相等 。 调 用 




















Vy ; 
男 SPSS 统计 软件 的 One- Way, ANOW 功能 ， 则 输出 结果 如 表 5- 10 和 表 5 -11 
【拓展 视频 】 并 Dy 
表 5-10(a) 基本 描述 统计 量 (Descriptives) 
95% Confidence 
Std. Std. 
N Mean Interval for Minimum | Maximum 
Deviation Error 
Mean 
Lower Upper 
Bound Bound 
1 5 67. 80 7. 396 3. 308 58. 62 76. 98 58 75 
2 5 83. 20 9. 524 4. 259 71. 37 95. 03 68 92 
3 5 73. 60 8. 234 3. 682 63. 38 83. 82 60 81 
Total 15 74. 87 10. 204 2. 635 69. 22 80. 52 58 92 





























由 表 5- 10(a) 可 以 看 出 ，3 种 教学 方法 的 样本 平均 值 有 一 定 差 异 ， 这 种 差异 是 否 显 
著 需要 通过 以 下 检验 完成 。 
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表 5-10(b) 方差 分 析 表 (ANOVA) 
Sum of squares Mean squares F Sig. 
Between Groups 604. 933 302. 467 4. 256 .040 
Within Groups 852. 800 71. 067 
Total 1457. 733 











表 5-10(b) 说 明 : 第 1 列 为 方差 来 源 ， 第 2 列 为 平方 和 (Sum of Squares)， 第 3 列 
为 自由 度 (df) ， 第 4 列 为 均 方 和 (Mean Square)， 第 5 列 为 下 统计 量 的 观测 值 ， 第 6 列 
为 下 统计 值 的 显著 性 概率 。 





由 表 5-10(b) 可 以 看 出 ,统考 成 绩 的 总 误差 平方 和 〈Total) 为 1457. 733， 如 果 仅 考 
虑 教学 方法 对 学 生 统考 成 绩 的 影响 ， 则 在 统考 成 绩 的 总 误差 平方 1 外， 不 同 的 教学 方法 可 
a end es, 的 总 误差 (Between 
Groups) 为 852. 800， 它们 的 均 方差 分 别 为 302. 467 RY} 7， 相 除 得 正统 计量 的 观测 值 
为 4. 256， 对 应 的 下 统计 值 的 显著 性 概率 值 p 一 0.640 六 三 0.05， 因 此 拒绝 零 假设 昌 ,， 认 
为 3 oO | 





A 


LA 实例 分 析 下 Ar 
TAN > > 
学 生 风 络 信 坟 状况 风 计 扒 


Re 


网 络 被 认为 是 -20\ 世 名 人 类 最 伟大 的 发 明之 = 它 在 发 挥 着 重要 作用 的 同时 也 带 来 一 
些 新 的 社会 问题 5 当代 大 学 生 是 利用 计划 所 网 络 这 一 新 技术 的 主力 军 ， 同 时 ， 他 们 在 使 用 
网 络 过 程 中 表现 出 染 的 网 络 依赖 问题 也 显 香 晶 益 突出 。 为 此 ， 某 高 校 教师 组 织 本 科学 生成 
立 一 个 调研 小 组 ， 进 行 了 抽样 调查 。 

外 国学 者 Young 认为 ， 病 态 财 博 与 病态 互联 网 使 用 的 内 在 特性 最 为 相似 ， 都 是 一 种 
不 涉及 被 摄 入 体内 的 成 痉 物 的 冲动 控制 性 障碍 。 根 据 此 观点 ， 她 修改 了 病态 赌博 诊断 标准 
并 用 于 在 线 调查 互联 网 成 疤 问 题 。Young 根据 修改 后 的 病态 赌博 诊断 标准 制定 的 互联 网 成 
瘤 的 评定 项 目 如 下 

(1) 你 是 否 迷恋 互联 网 或 其 他 网 上 服务 ， 并 在 下 线 后 仍然 念念不忘 ? 

(2) 你 是 否 感到 有 必要 花 更 多 的 时 间 去 网 上 寻求 满足 感 ? 

(3) 你 能 控制 自己 是 否 上 网 吗 ? 

(4) 如 果 减 少 了 上 网 时 间或 停止 上 网 ， 你 是 否 会 感到 不 安 或 愤怒 ? 

(5) 你 上 网 是 否 为 了 逃避 问题 或 为 了 减轻 无 助 感 、 犯 罪 感 、 焦 虑 、 抑 郁 ? 

(6) 你 是 否 欺 骗 家 人 或 朋友 以 隐瞒 你 上 网 的 频 度 和 在 线 时 间 ? 

(7) 你 是 否 为 了 上 网 而 不 惜 冒 失去 某 个 重要 关系 、 工 作 、 受 教育 机 会 或 谋 职 机 会 的 
风险 ? 

(8) 你 的 上 网 时 间 是 否 总 是 比 原先 预计 的 长 ? Young 指出 如 果 被 试 对 其 中 5 个 问题 
答 “ 是 ”， 就 被 认为 是 “上 注 ”"”。 这 一 标准 符合 病态 赌博 的 诊断 标准 ， 因 此 可 以 区 分 出 正常 
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的 互联 网 使 用 和 病态 的 互联 网 使 用 。(Young，1996) 

调研 小 组 借鉴 了 Young 的 指标 ， 并且 对 除 第 3 个 问题 外 的 每 个 问题 回答 “是 ”的 得 1 
分 ， 回答 “ 否 ” 的 得 0 分 ; 第 3 个 问题 回答 “和 否 ” 的 得 1 分， 回答“ 是 ”的 得 0 分 。 在 界 
定 网 络 依赖 程度 上 ， 把 总 得 分 为 0 一 1 看 作 无 依赖 ; 得 分 2 一 3 为 轻 度 依赖 ; 得 分 4 一 5 为 
较 重 依赖 ; 得 分 6 一 8 为 严重 依赖 。 

通过 随机 抽样 方法 抽取 最 终 的 调查 对 象 ， 做 深入 细致 的 调查 。 抽 取样 本 量 134， 问 卷 
收回 134 份 ， 经 过 数据 输入 整理 ， 最 后 有 效 问 卷 100 份 ， 问 卷 有 效率 74. 6%。 样 本 的 基本 
构成 如 表 5-11 所 示 ， 由 于 篇 幅 所 限 。 原始 数据 资料 略 。 


表 5-11 样本 基本 构成 表 



































性 别 家 庭 所 在 地 高 中 所 学 学 科 r 调研 对 象 
和 
女 4 农村 10 理科 70 “由本 科 生 32 
男 59 城镇 60 文科 | SAN N| 研究 生 68 
合计 100 合计 100 人 一 一 ob 合计 100 
需要 分 析 的 问题 


(1) 对 大 学 ee 

Dm 文科 生 与 理科 生 之 间 、 城 

镇 学 生 与 农村 学 生 之 间 、 se 

一 、 学 习 目 标 hv ,0h 

通过 本 案例 的 学 习 科学 和 失手 验 和 方差 分 析 的 基本 方法 及 
其 应 用 。 考 核 学 生 对 假 入 和 下 与 方 关 分 析 的 理 角色 。 

二 、 案 例 分 析 “ 人 一 < 

1. 大 学 全 癫 程度 现状 的 描述 性 究 祈 

通过 对 调查 数据 进行 分 组 整理 并 进行 频数 分 析 ， 得 到 表 5 - 12 所 示 的 结果 。 


表 5-12 大 学 生 网 络 依赖 状况 表 














Cumulative 
Frequency Percent Valid Percent 

Percent 
严重 依赖 和 350 0 3.0 
较 重 依赖 13 13.0 13.0 16.0 

Valid 轻 度 依赖 34 34.0 34.0 50.0 

无 依赖 50 50.0 50.0 100.0 
Total 100 100.0 100.0 

















从 本 次 调查 结果 来 看 ， 大 学 生 网 络 依赖 问题 是 存在 的 。 完 全 无 网 络 依赖 的 大 学 生 占 
50%， 轻 度 依赖 的 占 34 中 ， 较 重 依赖 和 严重 依赖 的 分 别 占 13% 和 3%。 
学 生 的 个 性 特征 对 网 络 依赖 程度 影响 的 差异 性 分 析 
网 络 依赖 程度 在 男生 与 女生 之 间 、 文 科 生 与 理科 生 之 间 、 城 镇 学 生 与 农村 学 生 之 间 、 


、 第 5 章 | 1 
统计 假设 检验 
研究 生 与 本 科 生 之 间 是 否 存在 明显 的 差异 呢 ? 研究 小 组 进一步 运用 了 SPSS 中 的 独立 样本 
t 检验 功能 来 推断 网 络 依赖 程度 是 否 在 不 同 个 人 基本 特征 上 存在 真实 的 差异 。 
1) 性 别 对 网 络 依赖 程度 的 影响 差异 
五 。 :男女 生 间 网 络 依赖 程度 无 明显 差异 
Hi: 男 女生 间 网 络 依赖 程度 有 明显 差异 
用 独立 样本 t+ 检 验 ， 得 出 统计 结果 如 表 5 一 13(a) 所 示 。 


表 5-13(a) 描述 统计 (Group Statistics) 


组 ” 别 N Mean Std. Deviation Std，Error Mean 
女 


| 41 LAL .680 .106 















v1 











.899 和 人 


表 5-13(a) 可 以 看 出 男生 和 女生 对 网 络 依 加 的 样本 天 淘 秸 有 一 定 差 ， 这 种 差异 是 
和 否 显著 需要 通过 以 下 检验 完成 ， 如 表 5-13(b) 所 示 》 站 a 


表 5-13(b) 两 独立 样本 1 检验 表 、 iependent Samples Test) 


Levene's 和 Equality 


AN bs t— test for Equality of Means 
XE 
WAN 


Mr 
水 Ne 5 全 > t gee 
产 一 tal 
Xe 1 


4. 040 RC .p47 0 98 .860 
. AN 

























.853 












观察 ! 检验 秆 ， 看 下 一 行 的 结果 ,1 统计 量 的 显著 性 ( 双 尾 ) 概率 p 二 0. 853 这 0.05， 
即 接受 零 假设 。 说 明 男 女生 间 的 网 络 依赖 程度 无 明显 差异 。 

2) 文理 科 生 对 网 络 依赖 程度 的 影响 差异 

HHo :文理 科 生 间 网 络 依赖 程度 无 明显 差异 

月: 文理 科 生 间 网 络 依赖 程度 有 明显 差异 

用 独立 样本 1 检验 ,得 出 统计 结果 如 表 5 一 14(a) 所 示 。 


表 5-14(a) 描述 统计 (Group Statistics) 











组 ” 别 N Mean Std. Deviation Std. Error Mean 
理科 70 1. 66 .849 .102 
依赖 
文科 30 La .685 .146 




















表 5-14(a) 可 以 看 出 文科 生 和 理科 生 对 网 络 依赖 的 样本 平均 值 有 一 定 差异 ， 这 种 差 
蜡 是 否 显著 需要 通过 以 下 检验 完成 ， 如 表 5 一 14(b) 所 示 。 
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表 5-14(b) 两 独立 样本 上 检验 表 (Independent Samples Test) 




















Levene's Test for Equality 
t- test for Equality of Means 
of Variances 
Si 
F Sig. t df 2 
(2 —tailed) 
依 | Equal variances assumed 一 .581 90 .563 
2.027 .158 
赖 | Equal Variances not assumed 一 .650 | 43. 107 .519 

















观察 上 检验 值 ， 看 上 一 行 的 结果 ， 人 统计 量 的 显著 性 〈 双 尾 ) 概率 p 二 0.563 记 0.05， 
即 接受 零 假设 。 说 明文 理科 生 间 的 网 络 依赖 程度 无 明显 差异 








| 

3) 家 庭 所 在 地 不 同 的 学 生 对 网 络 依赖 程度 的 影响 差异 信人 ” 
Ho ;家庭 所 在 地 不 同 的 学 生 间 的 网 络 依赖 程度 无 明显 其 测 、 
HH :家 许 所 在 地 不 同 的 学 生 间 的 网 络 依 六 程度 有 明 剖 医 弄 
用 独立 样本 ! 检验 ， 得 出 统计 结果 如 表 石 - TSCa 所 示 

表 5-15(a 描述 统计 ， (Group Statistics) 

组 ” 别 N \ 凡 A\ ean Se Deviation Std. Error Mean 
农村 ao SM 168 YN 145 























表 5-15 (a) 条 滩 在 出 农村 和 起 久 党 l 了 对 阅 络 依 炸 的 样本 平均 值 有 一 定 差异 ， 这 种 差 
到 是 否 显著 需要 通过 以 下 检验 完成 ， 如 和 ST5(b) 所 示 


表 5-15(b) 两 独立 样本 1 检验 表 (Independent Samples Test) 











Levene's Test for Equality 


t— test for Equality of Means 
of Variances 




















Sig. 
Sig. t df 
(2—tailed) 
依 | Equal variances assumed | 一 .150 | 98 .881 
1.056 .307 
赖 | Equal Variances not assumed | =-. 144 | 71.590 .886 








观察 :检验 值 ， 看 上 一 行 的 结果 , 人 统计 量 的 显著 性 〈 双 尾 ) 概率 户 一 0.881 二 0.05， 
即 接受 零 假 设 。 说 明 来 自 城镇 和 农村 的 学 生 间 的 网 络 依赖 程度 无 明显 差异 。 

4) 研究 生 和 本 科 生 对 网 络 依赖 程度 的 影响 差异 

:研究 生 和 本 科 生 间 的 网 络 依赖 程度 无 明显 差异 

互 1; :研究 生 和 本 科 生 间 的 网 络 依赖 程度 无 明显 差异 

用 独立 样本 上 检验 ,得 出 统计 结果 如 表 5-16(a) 所 示 。 
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统计 假设 检验 
表 5-16(a) 描述 统计 (Group Statistics) 
组 ” 别 | N Mean Std. Deviation | Std. Error Mean 
研究 生 | 68 1.76 .866 | .105 
依赖 
本 科 生 32 1.53 .671 .119 











表 5-16(a) 可 以 看 出 研究 生 和 本 科 生 对 网 络 依赖 的 样本 平均 值 有 一 定 差异 ， 这 种 差 
异 是 否 显著 需要 通过 以 下 检验 完成 ， 如 表 5-16(b) 所 示 。 
表 5-16(b) 两 独立 样本 1 检验 表 (Independent Samples Test) 


Levene's Test for Equality 


t ~ test for Equality of Means 

















of Variances 
二 
Sig, A 了 df ” 
用 < (2 — tailed) 
依 | Equal variances assumed 345 98 182 
四 | Equal Variances not assumed 1.473 | 76.775 .145 











网 答 检 验 值 ， 看 上 一 行 的 站 果 ， 代 统 让 量 阁 显 革 性 〈 双 尾 ) 概率 p 一 0. 182>>0.05， 
即 接受 零 假设。 说 明 研 究 生 与 本 科 生 间 的 同 括 依 区 程度 无 明显 差 内。 

3. 结论 SN 

通过 以 上 调查 结 时 的 里 现 和 分 六 六 们 可 以 但 到 如 下 下 花 : 

(1) 大 学 生 中 确实 存在 一 乱 程 度 上 的 网 络 依赖 问题 - 站 次 调查 显示 ，50% 的 学 生 无 风 
络 依赖 ， 343% 的 学 生 有 拓 捞 加 从 人 可 Ed 以 及 3% 的 学 生 有 严 
重 网 络 依赖 。 。 - 太 RS 

(2) 网 络 依 闫 程度 在 某 些 特征 上 没有 明 况 的 沿 异 。 调 查 发 现 ， 女 生 与 男生 在 网 络 依 闲 
程度 上 无 明显 洪江 3 文科 生 与 理科 生 在 网 络 依赖 程度 上 无 明显 差异 ;来 自 农 村 与 城市 的 学 
生 在 网 络 依赖 程度 上 无 明显 差异 ， 研究生 与 本 科 生 在 网 络 依赖 程度 上 也 无 明显 差异 。 


本 章 小 结 





假设 检验 是 统计 推断 的 重要 组 成 部 分 ,方差 分 析 是 一 种 重要 的 统计 推断 方法 ， 在 
一 定 意义 上 可 以 说 是 假设 检验 问题 的 推广 。 本 章 讲述 了 SPSS 统计 分 析 软 件 中 涉及 的 
这 两 部 分 的 基本 理论 及 方法 ,主要 包括 以 下 内 容 : 单 样本 的 均值 检验 、 独 立 样本 的 均 
值 检验 、 配 对 样本 的 均值 检验 、 独 立 样 本 的 方差 检验 及 单 因素 方差 分 析 。 


关键 术语 
hypothesis testing 假设 检验 null hypothesis 零 假设 
alternative hypothesis 备 择 假设 significance level 显著 性 水 平 


between means 抽样 分 布 critical value 临界 值 
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type T error 第 一 类 错误 type J error 第 二 类 错误 
two — tailed test 边 检验 one — tailed test 单 边 检 验 


one — way analysis of variance 单 因素 方差 分 析 

sum of squares within — groups 组 内 平方 和 

sum of squares between - groups 组 间 平 方 和 

total sum of squares 总 平方 和 analysis of variance table 方差 分 析 表 


:他 知识 链接 


[1] 赖 国教 ， 陈 超 , SPSS17 中 文 版 -统计 分 析 典 型 实例 精粹 [M]. 北京 : 电子 工业 出 版 社 ，2010. 
[2] 贾 俊 平 ， 部 静 . 统计 学 案例 与 分 析 [M]. 北京 : 中 国人 民 大 学 出 版 社 ，2010. 


习题 5 ,小 、 
gk 


1. ee 样 的 样本 容量 较 小 ， 做 均值 差 


入 约 和 天国 。 检验 时 应 采用 ( 。 )。 
4 A. Z 检 验 - 1 检验 
回 C. 妇 检验 “5 下 检验 


\ 
[5 知识] NXT- 


























多 _ 交 假设 检验 中 ， 当 显 深信 水 平 = oo1， 零 假设 被 拒绝 时 ， 则 用 “一 

i > XR 

A. 一 定 会 被 拒绝 你 :ee i 

C. 有 可 能 拒绝 零 假设 一 要 重新 检验 

3. 某 工 | 生产 品 ， enet er 25kg， 则 假设 检验 形 
式 为 (。)。 Na 

A. H. 5kg， Hi: uy>25kg B. Ho: y>25kg, Hi: y=25kg 

CG Sy =25kg, Hi: yz#25kg D. Ho: p<25kg, Hi: p>25kg 

4 方差 分 析 中 的 零 假设 是 关于 所 研究 因素 

A. 各 水 平方 差 是 否 相等 B. 各 水 平 的 均值 是 否 相等 

C. 同一 水 平 内 部 数量 差异 是 否 明显 。 D,. 各 水 平 之 间 的 相关 关系 是 否 密切 

5. 单 因素 方差 分 析 中 ,Ho : jp 二 pw 二 … 二 py,， 则 Ho 的 拒绝 域 为 〈 ) 

A. F>F,;: B. 下 全 下。 C. F<F,; D;: F<F, 

6. 车 Ho: py 寺 po， 抽 出 一 个 样本 ,其 均值 <<yo， 则 ( 5 

A. 肯定 拒绝 零 假设 B. 有 可 能 拒绝 零 假设 

C. 肯定 接受 零 假设 D. 有 可 能 接受 零 假设 

7. 显著 性 水 平 a ( Ww 

A. 是 当 零 假设 正确 时 却 被 拒绝 的 概率 

B. 实际 上 是 犯 第 一 类 错误 的 概率 

C. 实际 上 是 犯 第 二 类 错误 的 概率 

D. 取 值 越 大 ， 则 犯 第 一 类 错误 的 概率 就 越 大 

E. 就 是 临界 值 ， 即 检验 接受 域 与 拒绝 域 的 分 界 点 
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8. 在 假设 检验 中 ， 若 检验 结果 是 接受 零 假 设 昌 ,。， 则 下 面 结 论 中 ( ) 成 立 。 
A. 零 假设 一 定 成 立 B. 根据 样本 值 尚 不 能 推翻 零 假设 
C. 不 能 保证 零 假 设 为 真 D. 可 能 会 犯 第 二 类 错误 
E. 备 择 假设 一 定 成 立 
9. 车 下 服从 Np, 0), 且 避 未 知 ，Ho :py 二 pw 的 拒绝 域 为 ( Ys 
A. tit<—iws B. 之 一 lor2 C. tis D. Lt: 
E. | t | <i 
10. 显著 性 水 平 a 与 检验 拒绝 域 的 关系 是 ja 
A. 显著 性 水 平 提 高 意味 着 拒绝 域 扩大 B. 显著 性 水 平 提高 意味 着 拒绝 域 缩小 
C. 显著 性 水 平 降低 意味 着 拒绝 域 扩大 D. 显著 性 水 平 降低 意味 着 接受 域 扩大 











E. 显著 性 水 平 提高 或 降低 不 影响 拒绝 域 的 变化 入 
二 、 简 答题 ZK 
1. 区 别 下 列 概念 。 ~\ 
(1) 零 假设 与 备 择 假设 。 站 

(2) 双边 检验 与 单 边 检验 。 NT- 


(3) 左边 检验 与 右边 检验 。 

(4) 拒绝 域 与 接受 域 Ce 

(5) 第 一 类 错误 与 第 二 类 错误 。 

(6) 两 个 独立 样 eg 9、 

(7) 效应 误差 平方 和 与 大 机 误差 平方 和 。 x 

2. 统计 假设 检验 中 的 久 值 征 什么 Ba 太 针 进行 假设 检验 ? 

a 些 步 又 ? 

4 如 果 单 因素 方 基 分 析 的 结果 是 ， 向 ER 是 否 意味 着 两 
en 有 显著 差异 ? 

el 并 建立 零 假设 和 备 择 假设 。 

(0) 一 种 产品 的 标准 攻 朗 为 10cm， 灾 检 难 革 天 上 生产 的 产品 的 平均 长 度 直 5 符合 标准 
要 求 。 

(2) 环保 部 门 想 检 验 某 餐 馆 一 天 所 用 的 快餐 盒 平均 是 否 超 过 500 个 。 

(3) 某 公 司 经 理 希望 他 的 推销 员 注意 差旅费 的 限额 ， 经 理 要 求 推销 员 每 日 平均 费用 保 
持 在 60 元 。 做 出 这 个 规定 一 个 月 后 ， 得 到 每 日 费用 的 一 个 样本 。 经 理 利用 这 个 样本 考虑 
费用 是 否 在 规定 的 限额 之 内 。 

(4) 某 企业 每 月 发 生 事故 的 平均 次 数 是 4 次 ,该 企业 准备 制订 一 项 新 的 安全 生产 计 
划 ， 和 希望 新 计划 能 减少 事故 次 数 ， 试 检验 这 一 计划 的 有 效 性 。 

(5) 我 国 进口 的 一 批 特种 电缆 ， 规 定 平均 直径 为 Imm， 这 批 货物 到 达 后 ， 要 确定 是 
理应 当 接受 。 

(6) 丽华 厂 有 批 产 品 10000 件 ， 按 规定 的 标准 ， 出 厂 时 次 品 率 不 得 超过 3%， 质 量 检 
验 员 从 中 任意 抽取 100 件 ， 发现 其 中 有 5 件 次 品 。 检 验 这 批 产 品 能 否 出 厂 。 

(7) 某 农 研 所 研究 不 同 品种 的 水 稻 的 产量 要 检验 甲 品种 水 稻 的 平均 亩 产量 与 乙 品 种 
水 稻 的 平均 亩 产量 是 否 有 显著 差异 。 
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(8) 据 现 在 的 推测 ， 矮 个 子 的 人 比 高 个 子 的 人 寿命 要 长 一 些 。 通 过 统计 美国 31 个 自 
然 死亡 的 总 统 寿命 ,来 推断 上 述 推测 是 否 正确 。 

(9) 一 个 年 级 有 8 个 小 班 ， 他 们 进行 了 一 次 数学 考试 ， 检验 各 班级 的 平均 分 数 有 无 显 
著 差 异 。 

(10) 某 地 区 高 考 负 责 人 想 知 道 能 不 能 说 某 年 来 自 农 村 中 学 的 考生 比 来 自 城市 中 学 的 
考生 的 平均 成 绩 低 。 

6. 在 SPSS 统计 软件 操作 中 ， 请 回答 : 

(1) One- Samples T Test 模块 与 Paired - Samples T Test 模块 有 什么 关系 ? 

(2) Independent - Samples T Test 模块 与 Paired - Samples T Test 模块 的 数据 存放 方 
式 有 何不 同 ? 

(3) 在 Independent - Samples T Test 模块 ， | 为 什么 一 定 
要 选择 Levene (方差 齐 次 性 ) 检验 ? Xx 

(4) 在 One- Way ANOVA 模块 中 ， 定义 的 变量 有 几 个 7 者 是 什么 ? 数据 的 输入 有 何 区 别 ? 

7. 某 工厂 用 自动 打包 机 打包 ， 每 包 标准 质量 100kg 了 保证 生产 的 正常 运作 ， 每 天 
开工 后 需要 现 试 机 ， 检查 打包 机 是 否 有 系统 仿 莽 以 便 及 时 进行 调整 某 日 开工 后 在 试 机 
中 共 打 了 9 个 包 ,， 测 得 9 包 的 质量 〈 单 位 :~-kg) 如 下 : 

99.3 98.7 100.5 101.2 98.3 RR 99.5 102.1 100.5 

NS 和 

现 希 望 做 出 判断 ， 明确 打包 机 是 谷 答 要 迁 行 调整 。 

01) 做 出 零 假设 和 备 择 假设 入 XXX 

(2) 写 出 检验 用 统计 量 及 其 分 布 。 人 

(3) 车 采用 SPSS 统计 分 析 软 件 ， 

ZXA 表 5-17 Ohe-Sa 














ple Test 





Test Value= 100 











四 Sig. Mean 95% Confidence Interval of 
(2 — tailed) Difference the Difference 
Lower Upper 
weight 一 .055 8 .957 一 . 02222 一 . 9540 .9096 




















试 对 该 表 进 行 解释 ， 说 出 表 中 每 一 列 的 具体 含义 。 

(4) 根据 表 中 的 计算 结果 ,说 明 检验 的 结论 是 什么 。(a 可 取 0. 05) 

8. 为 了 保护 自然 环境 和 国家 资源 ， 防 止 汽车 尾气 对 大 气 环境 的 污染 而 引起 公害 ， 保 
障 人 民生 命 安全 与 健康 。 国 家 特制 定 了 环境 质量 标准 、 污 染 物 排放 标准 、 污 染 物 控制 标准 
等 。 若 汽车 发 动机 排放 标准 的 一 个 指标 平均 低 于 20 个 单位 ， 就 符合 北京 市 实行 的 汽车 尾 
气 排放 标准 。 现 在 改进 技术 前 后 ， 分 别 抽查 了 20 台 发 动机 之 后 ,得 到 下 面 的 排放 数据 : 

技术 调整 前 :20.2，22.5，20.8，23.2，21.0，22.6，19.5，22.0，19.0，25.6， 
0 

技术 调整 后 17.0, 22445717.95 19, .20.7 全 .43 21.8, 24.2, 20;4, 
19.9, 18.2, 20,3; 19.I 20,1, 18;5; 18.7; 19.7，18.9， 芭 .0。 
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试 分 析 技 术 改 进 前 后 汽车 尾气 排放 是 否 有 显著 差异 。(a 可 取 0. 05) 
(1) 做 出 零 假设 和 备 择 假 设 。 
(2) 若 采 用 SPSS 统计 分 析 软 件 ， 得 到 的 统计 分 析 结 果 如 表 5- 18 所 示 。 


表 5-18 Paired Samples Test 


Sig. 


Paired Differences t df 





(2 -tailed) 
Std. | 95% onfidence 
Std. 
Mean ds Error | Interval of the 
Deviation ¥ 
Mean Difference 





Lower | Uppe 入 





Pair 1 改进 较 术 前 = 1. 850 2. 3237 5196 7625 [Ads 3. 561 19 002 
改进 技术 后 ~ 





























对 该 表 进 行 解 释 ， 说 明 检验 的 结论 是 什么 。 NS- 
9. 设 有 3 台 机 器 ， 用 来 生产 规格 相同 的 合金 湾 板 。 取样 ， 测 量 薄板 的 厚度 精确 至 千 























分 之 一 厘米 ， 得 结果 如 表 5- 19 MS \ 
sii ec 
SA < 
0.248 AAS XO 0.259 
7 0l 254 0. 267 
0. 243 0. 261 0. 262 











假设 第 i 台 机 器 生产 的 薄板 厚度 xz; 服从 N (jp.o) (i 二 1,2,3)， 要 考察 这 3 台 机 器 生 
产 的 薄板 厚度 有 无 显著 差异 ? 
(1) 指出 该 案例 中 的 实验 指标 、 因 素 及 因素 水 平 各 代表 什么 。 
(2) 做 出 零 假 设 和 备 拌 假设 。 
(3) 若 采用 SPSS 统计 分 析 软 件 ， 得 到 的 统计 分 析 结 果 如 表 5 - 20 所 示 。 
表 5-20 薄板 的 厚度 统计 分 析 结果 

















Sum of 
df Mean Square bE Sig. 
Squares 
Between Groups .001 2 .001 32.917 .000 
Within Groups .000 12 .000 
Total .001 14 
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对 该 表 进 行 解释 ， 说 出 表 中 每 一 列 的 具体 含义 。 
(4) 根据 表 中 的 计算 结果 ， 说 明 检验 的 结论 是 什么 。 
三 、 判 断 题 








1. 零 假 设 正确 的 概率 等 于 a。 ( ) 
2. 如 果 零 假设 被 拒绝 ,那么 检验 证 明 备 择 假设 是 正确 的 。 ff 
3. 假设 的 所 有 检验 中 ， 犯 第 一 类 和 第 二 类 错误 的 概率 a 和 有 满足 十 B 一 1。 ( ) 
4. 按 假设 检验 的 形式 ， 可 以 把 假设 检验 分 为 左边 检验 与 右边 检验 。 ¢ 
5. 当 Ho 为 真 时 拒绝 Ho ， 犯 了 “ 弃 真 ”错误 。 ( ) 
6. 假设 检验 犯 两 类 错误 的 概率 可 以 同时 控制 。 ( ) 
7. 方差 分 析 是 一 种 比较 总 体 方差 差异 的 统计 方法 。 ( ) 
8. 方差 分 析 是 一 种 推断 变量 间 因 果 联 系 是 否 存在 的 统计 方 © 3 
四 、 计 算 题 办 
1. 在 某 个 城市 ， 家 庭 每 天 的 平均 消费 额 为 90 元 ， 该 上 市 中 也 机 抽取 15 个 家 庭 组 成 
一 个 随机 样本 ， 得 到 样本 均值 为 84. 50 元 ， rt 在 一 0.05 的 显著 性 水 平 


下 ,检验 假设 Ho :=90，Hi: /天 90。 

2. 一 家 汽车 生产 企业 在 广告 中 宣称 “ OO 24000km 内 无 
事故 ”， 但 该 汽车 的 一 个 经 销 商 认为 保证 C 折 这 一 项 是 不 必要 的 ， 因 为 有 用 户 反 映 在 2 
年 内 汽车 行驶 的 平均 里 程 超过 2i0QNSNC 人 人 Ho :1<24000, Hi: 
4>24000， 抽取 容量 n= 32 es > 年 行驶 里 程 的 平均 值 为 
24517km， 标准 差 为 1866km (we=0. 05) 

5。 某 市 环保 局 对 室 气 污染 物质 24h 的 最 大 wm 在 该 城市 中 随机 选取 
的 测量 点 来 检测 24h- 的 污 物质 量 。 数据 x Ng ) 如 下 : 

82, 97, 94, 35N 31, 91, 80, 87, > > 

流光 众人 服 人 正太 分 汕 ， 据 此 数据 你 认为 污染 物质 量 是 否 在 容许 范围 内 ? (a= 
0.05) 

4. 某 公 司 最 新 研制 的 汽车 发 动机 排放 标准 采用 新 兴 的 技术 ,投入 了 大 量 的 人 力 、 物 
力 精心 研制 。 经 测试 其 发 动机 排放 的 一 个 指标 平均 低 于 20 个 单位 。 有 关 人 员 在 抽查 了 10 
台 发 动机 之 后 ， 得 到 下 面 的 排放 数据 

这 

究竟 能 否认 为 该 指标 均值 低 于 20? (a 二 0.05) 

5. 从 一 个 方差 未 知 的 正 态 总 体 中 抽 得 样本 〈 一 0.2. 一 0.9. 一 0.6. 0.1)， 总 体 均 值 
为 uy。 试 在 a 二 0.05 的 水 平 下 ， 

(1) 检验 Ho :p 一 0， :0 天 0。 

(2) 检验 Ho :py 宇 0,，Hi :<0。 

(3) 检验 Ho :py0，Hi :p>0。 

(4) 前 三 者 的 结论 有 矛盾 吗 ? 为 什么 ? 

6. 因 卷 烟 的 尼古丁 含量 有 明确 规定 ， 对 于 某 卷烟 厂 生产 的 两 种 卷烟 ， 为 清楚 该 厂 两 
种 卷烟 产品 的 尼古丁 含量 差异 是 否 很 大 ， 以 便 调 整 生产 工艺 ， 所 以 用 假设 检验 方法 分 析 两 
种 烟 的 尼古丁 含量 有 无 显著 差异 。 





























全 计 假设 检 监 | 179 

现 分 别 对 两 种 卷烟 的 尼古丁 含量 做 6 次 试验 ， 结 果 如 下 : 

甲 : 25 28 23 26 29 22 

Zi 23 30 35 2 27 

若 卷烟 的 尼古丁 含量 服从 正 态 分 布 ， 且 方差 相等 ， 试 问 这 两 种 香烟 的 尼古丁 含量 有 无 
显著 差异 ? (a 二 0.05) 

7. 某 地 区 高 考 负责 人 猜测 某 年 来 自 农村 中 学 的 考生 比 来 自 城市 中 学 的 考生 的 平均 成 
绩 低 。 已 知 总 体 服 从 正 态 分 布 且 方 差 大 致 相同 ， 由 抽样 获得 如 下 资料 : 

农村 中 学 考生 : ni ==15, = 二 495,，S1 二 55; 

城市 中 学 考生 ; ns 二 17, zs 二 545，Sz 二 50。 

这 些 样本 数据 是 否 支 持 这 位 负责 人 的 猜测 ? (a 二 0. 05) 

8. 要 估计 两 家 连锁 店 日 平均 营业 额 是 否 有 差异 ， 在 第 一 分 并 和 得 平均 值 为 
2380 元 ， 样 本 标准 差 为 361 元 ， 第 二 分 店 抽查 25 天 ， 得 平 es 样本 标准 差 为 
189 元 。 问 在 a==0.05 和 a==0. 01 水 平 下 第 一 “ne a -分 店 的 日 营业 
额 ( 设 营业 额 服从 正 态 分 布 且 方差 相等 )。 

9. 有 两 台 机 器 生产 金属 部 件 ， 分 别 在 两 台 和 
人 测 得 部 件 重量 的 样本 方差 9 二 15. 46 和 号 二 9. 66， 设 两 样本 相互 独 

or (yw ,03)， 试 在 水 平 a==0.05 下 检验 假设 Ho : 
of =0;, Hi:of #0i。 we 

10. 设 X 与 并 为 两 个 独立 若 从 ER 人 ht,, 中)。 抽 样 后， 测试 计 算 
数据 为 ， > X 








在 a=0.05 条 件 下 ,检验 Ho :ol :o 

(1) 做 出 零 假设 和 备 择 假设 。 

(2) 写 出 检验 用 统计 其 。 

(3) 计算 统计 量 的 值 。 

(4) 查 表 求 出 临界 值 。 

(5) 写 出 检验 结论 。 

11. 企业 为 了 提高 生产 效率 ， 让 车 床 更 好 的 加 工 零 件 ， 自 动车 床 采用 新 旧 两 种 工艺 加 
工 同 种 零件 ， 测 得 的 加 工 偏差 (单位: km) 分 别 如 下 : 

[8 加 2 

站 

设 测量 的 加 工 偏差 服从 正 态 分 布 ， 所 得 的 两 个 样本 相互 独立 ， 且 总 体 方差 相等 。 试 问 
自动 车 床 在 新 旧 两 种 工艺 的 加 工 精度 有 无 显著 差异 ? (a 二 0. 01) 

12. 人 们 一 般 认 为 广告 对 商品 促销 起 作用 ,但 是 否 对 某 种 商品 的 促销 起 作用 并 无 把 握 。 
为 了 证 实 这 一 结论 ， 随 机 对 15 个 均 销 售 该 种 商品 的 商店 进行 调查 ， 得 到 数据 如 表 5 - 21 
所 示 。 
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表 5-21 15 个 销售 某 商品 的 商店 的 调查 结果 








商店 1 2 3 4 5 6 7 8 9 10 |11|12|13|14 15 
广告 前 | 2 多 | 2 “ 汪 医 - 3 | 3 $ | 2 落 小 法 3 六 3 3 
广告 后 | 2 3 3 4 4 2 3 4 3 3 4 2 3 4 4 















































请 以 显著 性 水 平 a 二 0.05 检验 广告 对 该 种 商品 的 促销 有 无 作用 。 
13. 随机 地 选 了 8 个 人 ,分 别 测量 了 他 们 在 早晨 起 床 时 和 晚上 就 寝 时 的 身高 ， 得 到 
表 5-22 所 示 的 数据 。 



































表 5-22 8 个 人 在 早晨 起 床 时 晚上 就 寝 时 的 身高 (单位 : cm) 
序 号 1 2 3 4 5 人 8 
早上 (x) 172 168 180 181 160 可 165 177 
晚上 (yi) 172 167 177 179 159 166 175 
设 各 对 数据 是 来 自 正 态 总 体 N (yp, op) i 的 身高 是 否 有 
显著 差异 ? (a 二 0. 05) 
14, 某 次 单 因素 方差 分 析 所 得 到 的 A 5 一 23 所 示 。 


表 5<23 方差 分 析 表 
来 源 高 差 平方 和 Ts - 均 方差 F 什 














组 间 370~14 | > F=9.16 
站 bx 

组 内 370 入 7 a 

总 和 y a 











a jz, 
《二 请 依次 填 世 空格 中 的 数字 。 原 方差 分析 问题 中 的 因子 分 成 几 个 水 平 ? 为 什么 ? 
(2) 说 明 此 方差 分 析 的 零 假设 和 备 择 假 设 。 
(3) 在 显著 性 水 平 为 a==0.10 时 ,说 明 方差 分 析 的 结果 是 什么 。 
15. 黑手 机 有 很 多 质量 问题 ， 其 中 电池 是 很 重要 的 一 个 方面 ， 待 机 时 间 很 短 ， 同 时 电 
压 不 稳 ， 导 致 手机 经 常 自动 关机 或 者 死机 。 质 检 部 门 对 3 种 品牌 的 手机 电池 进行 了 检测 ， 
检测 结果 如 表 5 一 24 所 示 。 


表 5-24 质 检 部 门 对 3 种 品牌 的 手机 电池 的 检测 数据 




















品牌 1 品牌 2 品牌 3 
40 26 39 
48 34 40 
38 30 43 
42 28 50 
45 32 50 











试 在 显著 性 水 平 c 一 0. 05 下 检验 3 种 品牌 电池 的 平均 寿命 有 无 显著 的 差异 。 
16. 从 某 学 校 同一 年 级 中 随机 抽取 19 名 学 生 ， 再 将 他 们 随机 分 成 4 组 ,在 2 周 内 4 组 
学 生 都 用 120min 复习 同一 组 英语 单词 ,第 一 组 每 个 星期 一 一 次 复习 60min; 第 二 组 每 个 
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星期 一 、 三 两 次 各 复习 30min; 第 三 组 每 个 星期 二 、 四 、 六 、 三 次 各 复习 20min; 第 四 组 
每 天 (星期 天 除外 ) 复习 10min。2 周 复习 之 后 ， 相隔 2 个 月 再 进行 统一 测验 ， 其 结果 如 
表 5-25 所 示 。 运 用 方差 分 析 法 可 以 推断 分 析 的 问题 : 这 4 种 复习 方法 的 效果 之 间 有 没有 
显著 性 差异 ? (a 二 0.05 和 一 0.01) 
表 5-25 4 组 学 生 英语 单词 测验 成 绩 表 




















序号 第 一 组 A 第 二 组 B 第 三 组 C 第 四 组 D 
24 29 30 27 
2 26 25 28 31 
3 20 21 32 32 
4 28 27 30 py 33 
5 28 26 队 














1. 某 生产 冰箱 的 企业 随机 地 对 其 国内 12 aed 大 中 型 商场 专卖 柜 中 的 40 台 冰 箱 
的 返修 率 进行 了 调查 ,调查 结果 如 表 5 - 26 A 已 知 同类 产品 的 标准 返修 率 为 1.1%， 
是 否 可 判定 近年 来 企业 生产 Wom 4 系统 因素 而 导致 质量 出 现 了 问题 ? ( 取 显 
著 性 水 平 一 0.05) 





表 |5- XN 台 冰 箱 的 返修 率 调 网 (单位 :5 





























2.2 WX2.1 AD. Lt 
2.1 一 2.9 RK 0.9 1.3 
17 < 1:8 ey 1.0 1.4 
NS 1.6 | 1.5 0.9 
1.4 74 ii i:3 I 
18 iig i 1.4 
1 1.8 1.4 1.5 
1.1 1.4 1.0 i 
1.0 1.3 1.1 1.2 
0.9 I i 1.0 

















2. 某 生产 电视 机 的 企业 现 从 采用 新 管理 模式 的 电视 机 生产 线 和 传统 管理 模式 的 电视 
机 生产 线 各 随机 抽取 10 条 .记录 其 月 产量 如 表 5- 27 所 示 。 又 假设 这 两 组 生产 线 的 实际 
产量 均 近 似 服 从 正 态 分 布 ， 判 断 新 的 管理 模式 和 传统 的 管理 模式 对 生产 线 产 量 有 无 显著 差 
异 。(a 二 0.05) 








表 5-27 10 条 电视 机 生产 线 月 产量 表 
序 号 1 2 3 4 5 6 | 7 8 9 10 
新 管理 模式 产量 /人 台 | 2000 | 2120 | 2000 | 2200 | 2100 | 2400 | 2030 | 2100 | 2008 | 2160 
传统 管理 模式 产量 / 台 | 1803 | 1980 | 2005 | 1900 | 2000 | 2200 | 1600 | 2000 | 1901 | 2001 
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3. 在 某 地 小 学 中 随机 抽取 30 名 肥胖 儿童 和 30 名 正常 儿童 ， 测定 其 血 中 LPO 含量 结 
果 如 下 : 

肥胖 组 : 

9. 21, 9.22; 9.22; 9.225 9.23; 9;24; 9.24;, 9.25, 9.25s 9.26; 9.27, 9.27 
9.28, 9.36, 9.36, 9.36, 9.37, 9.37, 9.36, 9.36, 9.36, 9.35, 9.35, 9.35, 9.35, 
9.33, 9.33, 9.33, 9.20, 9.20 

正常 组 : 

丰台 
7.585 DB. 六 T. 59s. Fd Wi605, 60 F605 人 605 TOLs Tdls F623 F062 
7.63, 7.63, 7.64, 7.64, 7.64 

试 检验 肥胖 儿童 血 中 LPO 含量 是 否 高 于 正常 儿童 。(a 一 0. 05 

和 产 了 和 区 六 时 ， 丰 用 这 5 人， 四 和 
们 饮用 某 种 减肥 茶 前 后 的 体重 数据 如 表 5- 28 所 示 。 性 


表 5-28 15 个 用 户 饮用 某 种 减肥 茶 后 的 体重 数据 (单位 :kg) 
编号 司 医 动 医 昼 医 司 区 滞 医 司 医 克 ,7 9g|i0|lu1|12|13|1M4|15 
饮用 前 66 |70|83|82 |62 | 93 | 85 | 78 | 75 
饮用 后 74 |54|ss | so |6s Ned e375 [7 es Ta |7 | 4 | oo9 





















































RS 二 
试 以 a=0.05 的 显著 性 水 平稳 验 该 种 减肥 茶 的 效 轩 是 害 显 车。 
5. 某 企业 为 提高 产品 产量 所 决 定 对 部 分 职工 进行 六 期 个 月 的 培训 。 为 了 了 解 培训 效果 


如 何 ， 从 经 过 培训 的 职 玉 了 体 市 各 随机 地 抽取 10 名 ， 记 录 当 月 产量 。 











又 假定 这 两 组 职工 的 实际 产量 均 近似 地 服从 正 ? 经 统计 ，10 名 职工 的 产量 分 别 如 下 : 
培训 前 :105 了 FS14, 14. 5，9, 9. 5 吝 8X42,13, 15 (单位 : 万 个 )，; 
培训 后 :人 2、13，13.5，16，11，9，10，14，10，15 (单位 ， 万 个 )。 
现在 我 们 要 求 通过 这 些 统计 数据 来 判断 该 企业 的 培训 效果 ,也 就 是 说 检验 培训 对 职工 
产量 提高 有 无 显著 性 影响 。(a 一 0. 05) 
6. 某 工厂 为 了 提高 生产 效率 ， 实 行 旱 、 中 、 晚 三 班 工作 制 。 工厂 管理 部 门 想 了 解 不 
同班 次 工人 劳动 效率 是 否 存 在 明显 的 差异 。 每 个 班次 随机 抽出 了 7 个 工人 ,得 工人 的 劳动 
效率 〈 件 / 班 ) 资料 如 表 5 - 29 所 示 。 试 分 析 不 同班 次 工人 的 劳动 效率 是 否 有 显著 性 差异 。 
































(a=0.05) 
表 5-29 工人 的 劳动 效率 
早 班 中 班 晚 班 
34 49 39 
37 47 40 
35 51 42 
33 48 39 
33 50 41 
35 51 42 
36 51 40 
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其 中 ， 早 班 的 工作 时 间 为 : 8:00 一 12:00; 中 班 的 工作 时 间 为 : 14:00 一 18:00; 晚 班 
的 工作 时 间 为 : 20:00 一 23:00。 
7. 为 了 对 几 个 行业 的 服务 质量 进行 评价 ， 消 费 者 协会 在 零售 业 、 旅 游 业 、 航 空 公司 
家 电 制 造 业 分 别 抽取 了 不 同 的 企业 作为 样本 。 其 中 零售 业 抽 取 7 家 ， 旅 游 业 抽 取 6 家 ， 航 
空 公司 抽取 5 家 ， 家 电 制 造 业 抽取 5 家 。 每 个 行业 中 所 抽取 的 这 些 企业 ,在 服务 对 象 、 服 
务 内 容 、 企 业 规模 等 方面 基本 上 是 相同 的 。 然 后 统计 出 最 近 一 年 中 消费 者 对 总 共 23 家 企 
业 投诉 的 次 数 ， 如 表 5- 30 所 示 。 
试 分 析 不 同行 业 的 投诉 次 数 是 否 有 显著 差异 。(e=0. 05) 


表 5-30 最 近 一 年 中 消费 者 对 23 家 企业 的 投诉 次 数 





























零 售 业 旅 游 业 航空 公司 ,二 家 电 制造 业 

57 68 31 XK 有 44 

66 39 | 51 

<- 

19 29 人 ai 65 

40 45 YN 厂 34 祝 

34 56 A 于 40 58 

a8 SX NN 三 

WA - 苞 F 














x Se 
& 某 眼 镇 实业 有 限 兴 名 着 了 调查 销售 祷 是 ;这 提请 方式 的 且 响 通过 数据 的 调查 获 
各 加 光 扩 8 所 加 区 起 折 ， bg 


不 
NU 表 5-31 调查 销售 额 是 否 受 促销 方式 影响 的 调查 数据 





























1 26 30 23 
2 22 23 19 
3 20 25 人 
4 30 32 26 
5 36 48 28 
6 28 40 23 
? 30 41 24 
8 32 46 30 














试 分 析 不 同 的 销售 方式 对 营业 额 是 否 有 显著 影响 。(a 一 0.05 和 a 一 0.01) 
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多 


1 . 实 训 项 目 : 大 学 英语 四 级 考试 成 绩 的 统计 推断 

ei de be de 

实 训 内 容 : 了 解 你 所 在 专业 大 学 英语 四 级 的 通过 情况 ,收集 样 本 数据 ， 利 用 本 章 学 到 
hte et 

(1) 随机 抽取 男生 和 女生 各 若干 人 作为 样本 ,获得 大 学 英语 四 级 考试 成 绩 的 数据 资 
料 ， 推 断 男生 和 女生 大 学 英语 四 级 考试 成 绩 是 否 有 显著 差异 。 

(2) 随机 抽取 参加 过 英语 四 级 考试 培训 的 学 生 若干 人 作为 样本 ,获得 培训 前 后 大 学 英 
2 


























2. 实 训 项 目 : 大 学 生日 常生 活 费 支出 的 统计 推断 
实 训 目的 : 学 会 运用 单 样本 : 检验 、 We 
解决 实际 问题 。 


实 训 内 容 : wht nnn ee 随机 抽取 大 学 
I 百 已 掌握 作为 样本 。 调 查 问卷 所 涉 
及 的 指标 包括 性 别 、 所 在 年 级 、 家 庭 所 在 二 区 \ 棕 明 来 自 于 城市 还 是 农村 )、 平 均 月 生活 
费 。 通 过 抽样 训 查 获得 大 学 生 月 平均 生活 部 支出 的 数据 资料 。 需 要 分 析 的 问题 如 下 : 

(1) 检验 你 自己 的 月 平均 生活 铂 是 固 澡 于 全 校 学 en 

(2) 检验 男女 学 生 的 月 平均 生活 费 是 用 2 

ree in th 

4) 检验 不 同年 级 学 生 的 月 平均 生活 费 是 

(5) 综合 以 上 化 计 推断 ， 写 出 统计 分 析 报 人 

3. 实 训 项 旧 ， 不 间 的 促销 方式 对 企业 莹 年 力 的 影响 分 析 

实 训 目的 ,全会 运用 独立 样本 ;检验 或 单 因素 方差 分 析 的 原理 和 方法 解决 实际 问题 。 

实 训 内 容 ， 在 如 今 的 超市 经 营 中 ， 各 种 各 样 的 促销 活动 繁多 ， 如 广告 宣传 、 有 奖 销 
售 、 特 价 销售 、 买 一 送 一 等 。 雪 良 置疑 ， 各 大 超市 进行 促销 活动 的 目的 是 要 增加 销售 量 ， 
增强 本 企业 的 市 场 竞争 力 。 但 是 究竟 促销 行为 对 增强 企业 的 竞争 力 是 否 有 显著 影响 ”选择 
哪 种 促销 方式 有 利 ? 这 一 直 是 企业 极为 关注 的 问题 。 

请 组 成 小 组 ， 通 过 实际 调研 了 解 超市 常用 的 促销 方式 ， 收 集 不 同 的 促销 方式 下 的 销售 
额 数据 资料 ， 利 用 本 章 学 到 的 理论 和 方法 进行 统计 推断 的 实践 。 需 要 分 析 的 问题 是 如 下 

(1) 不 同 的 促销 方式 对 该 类 商品 销售 额 的 增长 是 否 有 显著 影响 ? 若 有 显著 影响 ， 哪 种 
销售 方式 效果 最 好 ? 

(2) 是 否 任意 两 种 销售 方式 的 效果 之 间 都 存在 显著 差异 ? 


[和 家 例 恩 考 与 讨论 
对 于 大 学 毕业 生 工薪 的 统计 分 析 与 推断 


很 多 测评 机 构 在 比较 各 个 高 校 的 实力 或 比较 不 同 高 校 培 养 的 大 学 生 受 社会 欢迎 的 程度 
时 ， 不 仅 使 用 到 就 业 率 等 指标 ， 还 经 常用 大 学 毕业 生 的 工薪 高 低 来 衡量 。 要 反映 一 个 学 校 









有 最 著 差异 。 
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所 培养 的 大 学 生 的 工薪 水 平 ， 显 然 不 宜 用 该 校 全 部 学 生 工 薪 的 最 高 水 平 或 最 低 水 平 ， 否 则 
容易 受到 个 别 极端 值 (统计 上 也 称 为 异常 值 ) 的 影响 ， 通 常 应 采用 该 校 全 部 学 生 工薪 的 平 
均 水 平 、 工 薪 达 到 一 定 水 平 的 毕业 生 比 例 等 统计 指标 来 衡量 。 为 此 ， 随 机 抽取 一 定数 量 的 
大 学 毕业 生 构 成 的 样本 ， 通 过 对 样本 调查 所 获取 的 数据 来 推断 总 体 的 平均 水 平 或 某 一 比例 
等 数量 指标 。 

我 国 某 高 校 从 最 近 一 年 毕业 生 且 在 某 地 区 就 业 的 学 生 中 随机 抽取 36 名 进行 调查 ， 所 
得 的 样本 数据 如 表 5-32 所 示 ， 表 中 的 工薪 是 指 大 学 毕业 生 工 作 满 一 年 后 的 第 一 个 月 的 
工薪 。 


表 5-32 大 学 毕业 生 工 薪 的 抽样 调查 数据 










































































序 号 工薪 /元 序 号 工薪 /元 让 号 工薪 /元 
1 3300 13 3180 fs 3718 
2 4100 14 4160 J 26 3800 
3 4600 15 3260 和 \ 可 天 3380 
4 4000 16 ENE 28 1250 
5 2700 17 hoo 29 4060 
6 4500 18 ba" » 4050 30 3600 

EA 
2 3100 19; :区 3500 31 4260 
8 3900 SR 5500 ~， 32 3620 
9 4200 7 ~\X1 yp | EE 4350 
9 
10 3900 + “SS 22 el 34 3750 
下 3250 个 一 23 ”4$00 35 3680 
12 < 38007 24 wl 3900 36 4080 


思考 与 讨论) 题 ， 

(1) 以 3000、3500、4000、4500 为 组 限 ,将 样本 数据 进行 分 组 ， 并 编制 变量 数列 ， 
绘制 直方 图 ， 观 察 样本 数据 的 分 布 特征 。 建 议 用 SPSS 工具 来 完成 这 一 任务 。 

(2) 高 校 就 业 指导 部 门 认为 : 在 该 地 区 就 业 的 该 校 毕 业 生 毕 业 一 年 后 首 月 工薪 的 平均 
水 平 不 低 于 3700 元 。 试 对 这 个 问题 进行 假设 检验 ,在 显著 性 水 平 =0.05 下 ,抽样 调查 
结果 能 否 支 持 学 校 就 业 部 门 的 上 述 看 法 ? 

(3) 有 人 认为 “该 校 全 部 毕业 生 毕 业 后 一 年 首 月 工薪 在 4500 元 以 上 者 所 占 比 例 达 
10%”， 车 要 根据 案例 中 的 调查 数据 对 此 命题 进行 假设 检验 ,可否 采 用 Z 检验 〈 正 态 检 
验 )? 为 什么 ? 检验 结果 又 如 何 ? 


回执 达 回 


回 
【参考 答案 了 
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相关 及 回归 分 析 
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Fr N 
通过 本 章 的 学 习 ， 了 解 经 济 现象 之 间 的 相关 关系 ， 掌 相交 从 本 与 回归 分 析 的 基本 程序 及 




















SPSS 软件 的 操作 步骤 ， 学 会 对 现象 之 间 的 相关 关系 进行 分 析 和 预测 。 
A |\\ 
| «uD Ng 
.xu 
知识 要 点 能 力 \ 相关 知识 
E 够 者 本 的 得 关 关 系 及 
相关 分 析 le 关 关 系 、 相 关 分 析 、 相 关系 数 
关 程度 KZ 
” ¢ 回归 分 析 的 含义 、 一 元 线性 回归 模 
We i 型 、 参 数 的 最 小 二 乘 估计 、 回 归 方 
一 元 线性 回归 分 析 , 
人 洽 术 和 预测 yy 程 的 拟 合 优 度 检验 、 回 归 系 数 的 统计 
wy 和 检验 、 利 用 回归 方程 进行 预测 
A 并 立 元 , 线 虱 D 9 并 时 于 元 线 || D y 3 参 的 
A 能 够 建立 多 元 线性 回归 模型 并 进行 le 回归 参数 的 
分 析 和 预测 估计 
立 非 线性 回归 模型 并 进行 人 
非 线性 回归 分 析 和 入 本 全 间 病 后 加 光裕 型 半生 村 分 | 六 和 轴 基 币 省 回归 参数 的 估计 
析 和 预测 
“Bivariate Correlations” 对 话 框 、 
SPSS 统计 软件 | 能 够 熟练 使 用 SPSS 软 件 的 相关 和 回 | 。_ . 
EE “Linear Regression” 对 话 框 、“Cure 
操作 归 分 析 功能 并 对 给 出 结果 进行 正确 解读 
Estimation” 对 话 框 





相关 分 析 与 回归 分 析 是 处 理 变量 之 间 关 系 的 一 种 常用 统计 方法 。 利 用 这 种 方 

法 可 以 定量 地 建立 一 个 变量 关于 另外 一 个 或 几 个 变量 的 数学 表达 式 ( 即 数学 模 

型 )， 利 用 这 个 数学 表达 式 ， 可 以 对 该 变量 进行 预测 或 控制 。 近 年 来 ， 这 种 方法 

已 被 广泛 应 用 于 教育 学 、 经 济 学 、 社 会 学 、 医 学 、 心 理学 和 生物 学 等 诸多 领域 ， 

[拓展 知识 ] 并 取得 了 一 定 成 效 。 本章 结合 SPSS 统计 软件 ， 介 绍 常用 的 相关 分 析 、 回 归 分 析 
方法 。 
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消费 和 收入 一 一 2015 诺 贝尔 经 济 学 奖 研究 之 一 


2015 年 诺 贝尔 经 济 学 奖 于 北京 时 间 10 月 12 日 揭晓 ,该 奖项 单独 授予 美国 普林斯顿 大 学 经 济 学 系 安 
格 斯 。 迪 顿 (Angus Deaton) 教授 ， 以 表彰 其 在 消费 、 收 入 、 贫 穷 与 福利 方面 的 研究 贡献 。 此 次 授奖 旨 
在 表彰 迪 顿 在 3 个 核心 方面 所 做 出 的 杰出 贡献 ， 其 中 之 一 就 是 1990 年 迪 顿 发 现 了 消费 和 收入 之 间 的 实际 
关系 ， 即 “ 迪 顿 悖 论 ”。 

社会 收入 有 多 少 用 于 支出 ? 有 多 少 用 于 储 蕾 ? 为 了 解释 资本 信息 与 商业 周期 ， 有 必要 理解 收入 与 消 
费 之 间 的 时 间 变 化 关系 。 在 20 世纪 90 年 代 前 后 ， 迪 顿 发 表 若 干 论 文 ， 证 明 主 流 消 费 理论 无 法 解释 二 者 
之 则 的 实际 关系 。 过 顿 认为 ， 如 果 从 整体 收入 与 消费 数据 出 发 进行 研究 ， Le et 
体 收入 而 变化 ， 其 变化 关系 与 整体 数据 大 不 相同 。 em 析 个 体 数 据 是 我 们 理解 整 
体 数据 的 关键 ,而 迪 顿 的 研究 方法 也 日 渐 为 宏观 经 济 学 所 广泛 接 

迪 顿 的 研究 工作 表明 ， 在 理性 预期 下 ， ee i 得 到 了 消 
费 应 该 并 不 比 收入 平滑 的 结论 ， CA 比 收入 平滑 。 a 
伟 论 ”。 解 决 问题 的 关键 在 于 研究 个 体 消 费 者 的 收入 竹 为 ， 而 不 是 总 体 的 平均 (代表 性 个 体 )， 
ee 沁 步 的 研究 表明 ， We ea 


关 ， 对 于 不 可 预期 的 收入 并 不 敏感 NS 
消费 者 如 何 将 其 收入 在 各 个 时 期 进行 仿 配 ? 这 对 于 制定 促进 刘 经 济 政策 至 关 重 要 。 消 费 的 波动 
与 投资 的 波动 是 宏观 经 济 波动 的 主 蓝 原 加 人 总 总 消费 与 总 储 蕾 相册 个 国家 的 资本 形成 与 经 济 周期 
AR ge 


起 着 举足轻重 的 作用 。 传 统 的 ee nt ei es 
小 于 收入 的 波动 ， 这 是 因为 由 入 决定 的 ， 而 是 由 其 持久 收入 决定 的 ， 
持久 收入 相 比 当期 收入 > 


sta A ，2015. pe 
/ 


从 2015 诺 贝 尔 经 济 学 奖 得 主 安 格 斯 。 迪 顿 的 研究 成 果 看 ， 社 会 消费 与 居民 收入 之 间 
存在 必然 联系 ， 但 这 种 联系 不 是 一 一 对 应 的 函数 关系 ,二 者 之 间 的 关系 是 客观 的 ， 而 且 有 
较 高 的 密切 程度 。 那么 ， 这 两 者 之 间 存 在 多 密切 的 联系 ， 是 什么 性 质 的 联系 ， 能 不 能 把 它 
们 之 间 的 关系 确定 下 来 ， 可 和 否 根据 居民 的 收入 情况 数据 来 预测 社会 消费 品 零售 总 额 等 ， 这 
正 是 相关 分 析 及 回归 分 析 要 解决 的 主要 问题 。 


商业 银行 不 良 贷款 的 影响 因素 分 析 与 预测 


自 商 业 银行 产生 ， 风 险 就 与 之 相伴 、 形 影 不 离 。 与 一 般 工 商 企业 的 最 大 不 同 在 于 商业 银行 是 利用 客 
户 的 存款 和 其 他 借入 款 作 为 主要 的 营运 资金 进行 经 营 。 自 有 资本 占 比 低 这 一 特点 决定 了 商业 银行 具有 较 
强 的 内 在 风险 性 。 随 着 现代 经 济 的 不 断 发展 ， 商 业 银行 所 面临 的 风险 呈现 出 更 为 复杂 多 变 的 特征 。 从 对 
象 上 看 ， 商 业 银行 所 面临 的 风险 已 经 由 单一 的 借贷 产生 的 信用 风险 演变 为 包括 信用 风险 、 市 场 风险 、 操 
作风 险 等 在 内 的 多 类 型 风险 ; 从 性 质 上 看 ,商业 银行 所 面临 的 风险 从 最 初 的 局 部 风险 演变 为 全 球 风险 。 
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据 中 国 银行 监督 管理 委员 会 (简称 银监会 ) 初步 统计 ， 截 至 2015 年 年 底 ， 我 国境 内 商业 银行 〈 包 括 
国有 商业 银行 、 股 份 制 商业 银行 、 城 市 商业 银行 (简称 城 商行 )、 农 村 商业 银行 (简称 农 商行 ) 和 外 资 银 
行 ) 不 良 贷款 余额 12744 亿 元 ， 较 2014 年 年 末 的 8426 亿 元 新 增 4318 亿 元 ， 增 幅 达 到 51.25%。 不 良 贷 
款 率 为 1. 67 和 %， 同 比 上 涨 0. 42 个 百分点 ， 环 比 三 季度 末 上 升 0. 08 个 百分点 。 按 照 机 构 类 型 来 分 ， 农 商 
行 和 股份 制 商业 银行 不 良 贷款 增幅 最 高 ， 农 商行 的 不 良 增 幅 甚 至 超过 了 70% 。 股 份 制 商 业 银行 不 良 贷 款 
余额 2536 亿 元 ， 较 2014 年 年 末 的 1619 亿 元 ， 增 加 917 亿 元 ， 增 幅 为 56. 64%， 不良 贷款 率 为 1.53% 
较 年 初 上 升 0.42 个 百分点 。 农 商行 不 良 贷款 余额 1862 亿 元 ， 较 2014 年 年 末 的 1091 亿 元 增加 771 亿 元 
增幅 为 70. 67% ， 不 良 贷款 率 为 2. 48% ， 较 年 初 的 1. 87% 上 升 0. 61 个 百分点 。 同 期 ， 大 型 银行 2015 年 
年 末 不 良 贷 款 余额 7002 亿 元 ， 较 2014 年 年 末 4765 亿 元 增加 2237 亿 元 ， 增 幅 为 46. 95% ， 不 良 贷款 率 为 
1.66% ， 同 比 上 升 0. 43 个 百分点 。 城 商行 不 良 贷款 余额 1213 亿 元 ， 较 2014 年 年 末 的 855 亿 元 增加 358 
亿 元 ， 增 幅 为 41. 87 折 ,不 良 贷款 率 1.4 冯 ， 较 年 初 上 升 0. 24 个 百分点 。 外 资 银行 不 良 贷款 余额 130 亿 
emt 
分 点 。 

2015 年 不 良 贷款 有 四 大 风险 点 ， 首 先 就 是 农 商行 和 农业 银行 sy ， 其 次 西部 地 区 贷款 风险 凸 
显 ， 再 次 是 公司 贷款 恶化 较 快 ， 最 后 是 批零 、 制 造 业 是 重 灾 oy 016 年 银行 不 良 贷款 的 趋势 ， 大 部 
分 机 构 的 判断 依然 是 将 加 速 释放 。 东 兴 证 券 估 计 ， os 业 不 良 贷款 规模 将 超 2 万 亿 元 。 中 信 
建 投 对 2016 年 银行 业 不 良 市 场 展 望 时 预计 ， 0 不 良 率 将 副 
近 2%%。 不 良 贷款 的 加 速 暴露 ， gd pn 是 净利 润 增 速 疲乏 。 银监会 统计 数据 显示 ， 
2015 年 年 未 ， 商 业 银行 净利 润 15926 亿 元 有 2.43% 。 不 良 贷 表 的 增加 对 银行 业 而 言 压力 倍 
增 ， 对 于 不 良 资 产 处 置 市 场 而 言 却 是 风 国务 院 常务 会 议 明确 提出 ， ee 
置 。 银监会 主席 尚福 林 在 2016 年 合 国 儿 pe 多 元 化 、 
合 化 处 置 不 良 资产 的 能 力 。 FAD Et A 试点， 到 步 增 强 好 方 资产 管理 公 
司 处 置 不 良 资 产 的 功效 和 能 

2015 年 年 末 ， 银 行 Sheer wg anne se 其 中 商业 银行 总 次 
产 155. 83 万 亿 元 ， 同 屁 增 长 15.6%。 同 期 商 资本 充足 率 13.45%， 一 级 资本 充足 率 11. 31 和 6 ， 核 
ne 这 是 一 份 令 世界 惊 疤 往 称 美的 业绩 报告 。 的确， 在 世人 了 眼 里 ， 新 中 国 成 立 
60 年 来 特别 是 开放 30 年 中 国 商业 银行 业 发 生 了 历史 巨变 。 中国 商 业 银 行业 的 整体 实力 和 抗 风险 
能 力 已 今 非 苦 比 。 但 尽管 如 此 ， 我 国 商业 银行 的 不 良 贷款 问题 仍 十 分 严峻 ， 由 之 可 能 引起 的 金融 动荡 也 
是 不 可 忽略 的 难题 ， 必 须 采 取 措 施加 以 解决 。 

随 着 我 国 经 济 的 飞速 发 展 ， 找 出 影响 商业 银行 不 良 贷款 的 主要 影响 因素 ， 进 行 科学 合理 地 分 析 和 预 
测 ， 以 尽 可 能 地 防范 和 化 解 不 良 贷款 问题 迫在眉睫 。 

资料 来 源 : 轻 金 融 综合 海通 证 券 、 一 财 网 。 


不 良 贷款 问题 一 直 是 国际 银行 业 面 临 的 重大 问题 。 美 国 的 银行 在 20 世纪 70 年 代 和 80 
FE 代 曾 有 过 南美 债务 危机 ， 近 年 日 本 银行 也 存在 大 量 的 坏账 。 我 国 的 工 、 农 、 中 、 建 四 大 
有 独资 商业 银行 〈 以 下 简称 四 大 商业 银行 ) 也 一 直 为 大 量 的 银行 不 良 资 产 所 困扰 。 商 业 
银行 大 量 不 良 贷款 的 存在 ， 已 经 对 商业 银行 的 正常 经 营 与 发 展 产生 了 严重 影响 ， 使 金融 对 
经 济 承 担 助 推 器 的 功能 难以 有 效 发 挥 。 目 前 .我国 商 业 银 行 的 巨额 的 不 良 贷 款 形成 原因 复 
杂 ， 外 部 原因 主要 是 国家 产业 政策 调整 、 金 融 体 系 不 完善 、 信 用 风险 等 ， 内 部 原因 主要 是 
银行 内 部 控制 缺陷 、 操 作风 险 、 银 行 队伍 人 员 素质 不 高 等 。 通 过 相关 分 析 和 回归 分 析 方法 
对 影响 商业 银行 不 良 贷款 的 主要 因素 进行 科学 地 分 析 及 合理 地 预测 ， 可 以 有 效 地 防范 和 降 
低产 生 不 良 贷款 的 风险 。 
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6.1 相关 分 析 


6.1.1 变量 间 的 关系 


在 现实 生活 中 ,普遍 存 在 变 其 之 间 的 关系 。 统 计 分 析 的 目的 就 在 于 如 何 根据 统计 数据 
确定 变量 之 间 的 关系 形态 及 其 关联 程度 ， 并 探索 出 其 内 在 的 数量 规律 性 。 回 并 % 回 

变量 之 间 的 关系 一 般 来 说 可 以 分 为 确定 性 和 非 确定 性 两 种 。 确 定性 关系 。 沿革 员 
是 指 存在 某 种 函数 关系 。 然 而 ， 更 常见 的 变量 之 间 的 关系 表现 出 某 种 不 确定 商 

这 种 既 有 关联 ， 又 不 存在 确定 性 的 关系 ， 称 为 相关 关系 。 分 、 【拓展 案例 】 

1 确定 性 关系 AAA 

确定 性 关系 能 够 用 确定 的 函数 表达 式 表达 变量 之 间 芍 关系 ， 这 种 关系 是 我 们 所 熟悉 
的 。 设 有 两 个 变量 X 和 Y， 变 量 了 随 变量 X 的 变化 而 次 化 ， 并 完全 依赖 于 X， 当 变量 X 
取 一 定 值 时 ，Y 可 以 依 确定 的 关系 取 相应 的 值 则 Y 是 X 的 函数 ， 记 为 了 = /(CX)， 其 中 
XX 称 为 自 变量 ,Y 称 为 因 变 量 。 例 如 ， 出 得 汽 全 委 用 了 与 行 豫 里 程 X 及 每 公 里 单价 之 
间 的 关系 可 用 Y 一 PX 来 表示 ， 即 在 每 公开 单价 已 确 定时 ， 给 出 行驶 里 程 X 便 可 唯一 地 确 
定 出 汽车 费用 Y， 这 时 Y 与 X 是 sc 对 应 的 确定 性 关系 2 

2 相关 关系 2 wi 

1) 相关 关系 的 含义 一 

相关 关系 (CEirejmion) 是 现实 中 普 6 不在 汐 灾 Lt 之 间 的 关系 ， 它 无 法 用 确定 的 函数 
表达 式 表达 。 允 于 一 个 变量 的 一 个 数值， 待 往 有 另 一 个 变量 的 许多 可 能 值 相对 应 。 例 如 ， 
家 庭 的 支出 与 收入 之 间 的 关系 ， 收 入 确定 后 ， 支 出 并 不 随 之 而 定 。 收 入 高 的 家 庭 一 般 来 说 
支出 水 平 也 高 ， 但 对 于 同等 收入 水 平 的 家 庭 其 支出 并 不 一 定 一 样 。 对 于 这 种 不 确定 变量 显 
然 不 能 用 函数 关系 进行 描述 ， 但 是 通过 大 量 样本 数据 资料 的 观察 与 研究 ， 我 们 就 会 发 现 许 
多 变量 之 间 确 实 存在 一 定 的 客观 规律 性 。 相 关 分 析 与 回归 分 析 正 是 描述 与 探索 不 确定 变量 
之 间 关 系 及 其 规律 的 统计 方法 。 

2) 相关 关系 的 类 型 

根据 变量 之 间 的 影响 方向 和 影响 程度 等 ， 相 关 关 系 可 以 分 为 不 同类 型 。 

根据 变量 之 间 的 相关 方向 ， 相 关 关系 可 分 为 正 相 关 和 负 相关 。 正 相关 是 指 当 一 个 变量 

的 数量 增加 或 减少 ) 时 ， 另 一 个 变量 的 数量 也 随 之 增加 《或 减少 ); 负 相关 是 指 当 一 个 
变量 的 数量 增加 (或 减少 ) 时 ， 另 一 个 变量 的 数量 随 之 减少 (或 增加 ) 。 

根据 变量 之 问 的 相关 程度 ， 相 关 关系 可 分 为 完全 相关 、 完 全 不 相关 和 不 完全 相关 。 完 
全 相关 是 指 变 量 之 间 是 函数 关系 ; 完全 不 相关 是 指 变 量 之 间 彼 此 互 不 影响 ， 其 数量 变化 各 
自 独立 ;不 完全 相关 是 介 于 完全 相关 和 完全 不 相关 之 间 。 一 般 的 相关 关系 都 是 指 完全 不 
相关 。 

根据 变量 之 间 的 相关 形式 ， 相 关 关系 可 分 为 线性 相关 和 非 线性 相关 。 线 性 相关 是 指 变 
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量 之 间 的 关系 近似 地 表现 为 一 条 直线 ; 非 线 性 相关 是 指 变量 之 间 的 关系 近似 地 表现 为 一 条 
曲线 。 

根据 所 研究 的 变量 的 个 数 ， 相 关 关 系 可 分 为 单 相关 、 复 相关 和 偏 相关 。 单 相关 是 指 研 
究 两 个 变量 的 相关 关系 ; 复 相关 是 指 研究 一 个 变量 对 两 个 或 两 个 以 上 变量 的 相关 关系 ; 偏 
相关 是 指 在 研究 多 个 变量 之 间 的 相关 关系 时 ， 假 定 其 他 变量 不 变 ， 只 研究 其 中 两 个 变量 的 


6.1.2 相关 分 析 的 含义 及 表现 方法 





相关 分 析 (Correlation Analysis) 是 根据 实际 观察 的 数据 资料 ， 在 具有 相关 关系 的 变 
量 之 间 ， 对 现象 之 间 的 依存 关系 的 表现 形式 和 密切 程度 的 研究 ， 它 处 理 的 是 一 种 相互 














关系 

我 们 可 以 用 两 种 方法 来 表现 变量 间 的 相关 关系 ， 一 种 方 ann 
表现 ， 另 一 种 方法 是 通过 相关 系数 来 反映 。 通过 图 形 和 攻 避 方式 ， 能 够 有 效 地 揭示 变 
量 之 间 关 系 的 强 弱 程 度 。 

1. 散 点 图 -+ 

散 点 图 (Scatter Plots) 就 是 :将 数据 以 的 形式 夯 在 直角 平面 上 ， 通过 点 组 成 的 图 形 
来 观察 两 变量 之 间 的 相关 关系 。 其 具体 做 法 法 如 下 ， ee 量 X， 纵 坐标 代表 因 
变量 Y， 通 过 观察 或 实验 可 以 得 到 若 十 组 数据 〈z， ， 将 其 在 平面 直角 坐标 系 中 用 点 来 
表示 ， 称 之 为 散 点 ， 这 样 的 图 箭 称 4 散 点 图 。 上 最 Y 5 图 如 图 6. 1 所 示 。 

YK \ 和 











X 华 Xda 
> ~ ) ey 
:i 大 2 
NS pe 
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图 6.1 变量 Y 与 X 的 散 点 图 


散 点 图 是 研究 相关 关系 的 直观 工具 ， 一般 在 进行 详细 的 定量 分 析 之 前 ， 可 以 利用 它 对 
变量 之 间 存 在 的 相关 关系 的 方向 、 形 式 和 密切 程度 进行 大 致 判断 。 我 们 可 以 借助 于 SPSS 
统计 软件 来 绘制 散 点 图 ， 具 体操 作 过 程 在 第 4 章 已 有 详细 介绍 。 

2. 相关 系数 (Correlation Coefficient) 

通过 散 点 图 ， 我 们 对 变量 之 间 的 相关 关系 的 存在 进行 了 定性 的 判断 。 而 统计 学 是 一 门 
计量 科学 ,需要 我 们 在 定性 研究 的 基础 上 进一步 做 定量 分 析 ， 即 不 仅 要 知道 变量 之 间 是 否 
相关 ， 还 要 进一步 知道 相关 的 程度 和 方向 。 为 此 ， 我 们 引入 相关 系数 ， 以 数值 的 形式 比较 
精确 地 反映 变量 间 相 关 的 强 弱 程度 。 

1) 相关 系数 的 定义 

相关 系数 (Pearson's Correlation Coefficient)。 又 称 Pearson 相关 系数 (软件 中 常用 
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此 名 称 )， 它 是 根据 样本 数据 计算 的 对 两 个 变量 之 间 线 性 关系 强 弱 的 度量 值 ， 用 ~ 来 表示 。 
若 相关 系数 是 根据 总 体 全 部 数据 计算 的 ， 则 称 为 总 体 相关 系数 ， 记 为 p。 
2) 样本 相关 系数 的 计算 公式 


设 (zi,y) (i 二 1,2,…,n) 是 来 自 总 体 (X,Y) 的 样本 ,二 TD = 
则 样本 相关 系数 的 计算 公式 为 


Dj;— Dy = 、 
r i = (6-1) 


| 一 站 六 (yi 一 忆 )2 
i=1 i=1 

















AN 

Su = Dz;—a)(y,—y) 2 a 
i=1 Pp Cr he 

Ss 2 (一动 SR i (2*) 人 
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Sy Dt NS 2 (2 (6 一 4) 
so 2 多 
% XL 
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Ff a 
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NS 使 用 Pearson 相关 系数 的 要 求 


要 正确 地 将 Pearson 相关 系数 作为 测量 变量 X 和 Y 之 间 相 关 性 的 一 个 指标 ， 必 须 考虑 以 下 要 求 : 

(1) 线性 关系 。Pearson 相关 系数 只 用 于 侦 测 X 和 之 问 的 线性 关系 。 

(2) 随机 抽样 。 样 本 成 员 必 须 是 随机 地 从 一 个 用 来 进行 显著 性 检验 的 总 体 中 抽取 的 。 

(3) 正 态 分 布 。 对 相关 系数 进行 显著 性 检验 要 求 X 和 了 在 总 体 中 都 呈正 态 分 布 。 在 小 样本 中 ， 不 符 
合 正 态 分 布 要 求 的 情况 将 会 严重 影响 检验 的 有 效 性 。 但 是 ， 当 样本 规模 超过 了 30 个 案例 时 ， 这 个 要 求 就 
不 那么 重要 了 。 


3) 相关 系数 的 意义 

(1) 0<r<1 表示 两 个 变量 间 存 在 正 线性 相关 关系 ; 回 赵 党 加 
这 
首 





(2) 一 1<r<0 表示 两 个 变量 间 存在 负 线 性 相关 关系 ; 

(3) r 一 0 表示 两 个 变量 间 不 存在 线性 相关 关系 ; 

(4) |r|=1 表示 两 个 变量 间 存 在 完全 线性 相关 关系 ; 【期 刊 推荐 】 
(5) |r| 越 接近 于 0， 表 示 两 个 变量 间 的 线性 相关 程度 越 低 ; 

(6) | | 越 接近 于 1， 表示 两 个 变量 间 的 线性 相关 程度 越 高 。 

变量 Y 与 X 间 的 相关 系数 示意 图 如 图 6. 2 所 示 。 
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< 人 ~(e) r~0 
NX 图 6.2 二 

根据 样本 数据 计算 出 的 相关 系数 值 一 般 都 在 一 1 和 1 之 间 ， 
线性 相关 程度 时 ， 表 6 - 1 中 的 相关 等 级 划分 标准 可 以 提供 参考 ， 
建立 在 相关 系数 通过 显著 性 检验 的 基础 之 上 。 


表 6-1 相关 系数 等 级 划分 


(b) r=-1 





(人 r=0 





在 判断 两 个 变量 之 间 的 
但 是 这 种 参考 标准 必须 





|-|<0.3 0.3<|r|<o0.5 


"的 取 值 


0.5<|r|<o0.8 


| >-| 三 0.8 








低 度 线性 相关 





不 线性 相关 








4) 相关 系数 的 检验 
计算 样本 相关 系数 的 目的 是 用 来 说 明 样 本 来 自 的 两 总 体 之 间 是 否 具有 显著 的 线性 相关 
性 。 但 是 ， 由 于 存在 抽样 的 随机 性 和 样本 数量 较 少 等 原因 ， 通常 导致 推断 的 可 信 程度 不 





高 。 因 此 需要 通过 假设 检验 的 方式 对 样本 来 自 的 两 个 
计 推 断 。 相 关系 数 检验 的 步骤 如 下 : 

(1) 提出 假设 ，Ho:o=0 Hi:p 才 0。 

(2) 构造 检验 统计 量 。 











中 度 线性 相关 





高 度 线性 相关 





总 体 是 否 存在 显著 的 线性 相关 进行 统 
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在 Ho 成 立时 ,检验 统计 量 


人 一 各 


(3) 给 定 显 著 性 水 平 a， 查 表 确 定 临界 点 起 (n 一 2)。 

(4) 确定 拒绝 域 . |t| 写 ts (n 一 2)。 

(5) 做 统计 决策 : 车 | 三 ws (x 一 2)， 则 拒绝 有 H,， 说 明 两 总 体 之 间 线 性 关系 显著 ; 否 
则 ， 认 为 两 总 体 之 间 线 性 关系 不 显著 。 

需要 说 明 的 是 ，SPSS 统计 软件 中 的 相关 系数 检验 结论 是 通过 检验 统计 量 的 显著 性 概 
率 己 值 来 做 出 的 。 也 就 是 说 ， 如 果 忆 值 小 于 给 定 的 显著 性 水 平 c， 则 应 拒绝 回 基 党 回 
零 假 设 瓦 , ， 认 为 两 总 体 之 问 线性 关系 显著 。 本 章 后 面 的 显著 局 2 
据 检验 统计 量 的 显著 性 概率 已 值 进 行 决策 的 。 为 又 SS 


SK 
@ made-! 区 局 se 


wanna 


A 长 提出 教堂 能 洁净 人 们 的 心灵 ,减少 犯罪 ,降低 监 
狱 服刑 人 数 的 口号 。 为 了 增进 民众 参与 教会 的 神父 收集 了 近 15 年 的 教堂 数 与 在 监狱 服刑 
的 人 数 进行 统计 分 析 。 结 果 却 令 教会 天 吃 、 有 寺 8 禾 肖 外 入 人 恒信 半 生硬 名 下 相关 那么 
是 否 可 以 由 此 得 出 ， 教堂 建 得 越 光 [就 可 能 六 来 更 多 的 犯 之 和 县 汪 计生 家 和 教会 神 人 深入 讨论， 并 
进一步 收集 近 15 年 的 当地 灾 志 3 料 和 犯罪 率 等 资 做 述 X 霄 分 析 ， 发 现 监狱 服刑 人 数 的 增加 和 教堂 
2 NE: Ne 至 此 ， 教 会 人 士 总 算 松 了 
一 口气 。 
资料 来 源 : No 现代 统计 学 CMJ. 人 应 南 图书 出 版 有 限 公司 ， 1999. 
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运用 相关 系数 判断 两 个 变量 相关 程度 高 低 时 的 注意 事项 


在 实际 应 用 中 ,运用 相关 系数 判断 两 个 变量 相关 程度 高 低 时 需 注意 : 

(1) 相关 系数 是 一 个 无 量 纲 的 量 ， 它 可 以 进行 比较 。 

(2) 两 个 变量 相关 程度 的 高 低 取决 于 相关 系数 绝对 值 的 大 小 ， 而 不 是 相关 系数 数值 的 大 小 。 

(3) 相关 系数 是 一 种 对 称 测量 ,因此 相关 关系 不 等 于 因果 关系 。 

(4) 计算 相关 系数 要 求 变 量 值 对 应 的 项 数 nn 要 大 一 些 ， 否 则 ,不 易 做 出 正确 判断 ; 另外 ,极端 值 也 
可 能 影响 相关 系数 。 

【 例 6.1】 在 【导入 案例 6-1】 中 ,主要 探讨 的 是 社会 消费 品 零售 总 额 与 居民 收入 之 
间 的 相关 关系 。 下 面 通过 2014 年 全 国 16 个 省 市 城镇 居民 消费 支出 与 人 均 可 支配 收入 的 数 
据 资 料 ， 分 析 居 民 消 费 与 收入 之 间 的 相关 关系 ,要 求 计算 城镇 居民 消费 支出 与 人 均 可 支配 
收入 之 间 的 相关 系数 并 进行 显著 性 检验 。( 显 著 性 水 平 a 一 0. 05) 


~t(n—2) 
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表 6-2 2014 年 各 省 市 消费 支出 与 可 支配 收入 数据 (单位 ; 千 元 ) 

省 市 可 支配 收入 消费 支出 省 市 可 支配 收入 消费 支出 
北京 44. 49 36. 06 上 海 45. 96 43.01 
天 津 28. 83 28. 49 江苏 27. 17 28. 32 
河北 16. 65 12. 17 浙江 32. 66 26. 88 
山西 16. 54 12. 62 安徽 16. 79 12.%5 
内 蒙古 20. 56 19. 83 福建 23. 33 19. 09 
适 守 22. 82 22. 26 江西 16. 73 12. 00 
吉 17. 52 13. 66 山东 20. 86 19. 18 
15. 22 河南 15. 69 13. 08 

I 





解 :1) 绘制 攻 点 图 。 调 用 SPSS 的 绘制 做 点 阁 功 能 得 到 城镇 居民 消费 支出 与 人 均 
可 支配 收入 的 散 点 图 ， 如 图 6. 3 所 示 。 人 
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3000 
可 支配 收入 / 千 元 
6.3 城镇 居民 消费 支出 与 人 均 可 支配 收入 的 散 点 图 


由 图 6. 3 可 以 看 出 ， 城 镇 居民 消费 支出 与 人 均 可 支配 收入 呈 明 显 的 线性 趋势 。 
(2) 计算 相关 系数 并 进行 显著 性 检验 。 城 镇 居民 消费 支出 与 人 均 可 支配 收入 相关 系数 
辅助 计算 表 如 表 6 一 3 所 示 。 


20.00 


表 6-3 城镇 居民 消费 支出 与 人 均 可 支配 收入 相关 系数 辅助 计算 表 
































可 支配 收入 XX 2 0 
北京 44. 49 36. 06 1979. 36 1300. 32 1604. 31 
天 津 28. 83 28. 49 | 831.17 811. 68 821. 37 
河北 16. 65 12:17 | 277. 22 148. 11 202. 63 
山西 16. 54 12. 62 273. 57 159. 26 208. 73 
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( 续 ) 

省 市 可 支配 收入 X | 消费 支出 Y 到 Y 
内 蒙古 20. 56 19. 83 422. 71 393. 23 407. 70 
征 宁 22. 82 22. 26 520.75 495. 51 507. 97 
吉林 17:52 13. 66 306. 95 186. 60 239. 32 
黑龙 江 17.40 S22 302.76 231. 65 264. 83 
上 海 45. 96 43. 01 2112. 32 1849. 86 1976. 74 
江苏 27.17 28. 32 738. 21 802. 02 769. 45 
浙江 32. 66 26. 88 1066. 68 722.53 877. 90 
安徽 16.79 12. 95 281. 90 67%70 217. 43 
福建 23. 33 19. 09 544.29 J < ,43 445. 37 
江西 16.73 12. 00 279. 89 | 144. 00 200. 76 
山东 20. 86 19.18 (5 PS 367. 87 400. 09 
河南 15. 69 13.08 [sw SS 171. 09 205. 23 
合计 384. 00 334. 82/ 4 (10619.10 8315. 86 9349. 83 























| 
根据 相关 系数 公式 (6- 1) 一 公开 -4) 得 了 











n MT \ , AY 
i = Dy = 9349. 83 > 384. 00 X 334. 82 一 1314. 15 
i i=]1 
Fr Ea 


一 1 






Su 一 Du (2x) = loglgao Si/16) x 384. 007 二 1403. 10 国 直 ss 


Now fa < ms 

















Sy 好 1 (Dy,) 8315. 86 一 (1/16) X 334. 82? A 1309. 333 【期 刊 推荐 
i=1 i=l 

-ES 1314. 15 Sad dd 
SuSw Vi403.1 xX V1i309.33 


即 城镇 居民 消费 支出 与 人 均 可 支配 收入 之 间 的 相关 系数 为 0.969， 说 明 二 者 之 间 存 在 高 度 
的 正 线 性 相关 关系 。 

相关 系数 的 显著 性 检验 如 下 : 

名 提出 假设 ，Ho :p= 二 0; Hi:p 冯 0。 

@ 计算 检验 统计 量 的 值 : 


一 2 
,2 0.969X VI6—3 4 go 


Ml V1 一 0. 9692 


@ 显著 性 水 平 a 二 0.05，to.025 (14) 一 2.1448。 由 于 之 tos(14)， 因 此 拒绝 Ho， 
说 明 城 镇 居民 消费 支出 与 人 均 可 支配 收入 之 间 线 性 关系 显著 。 
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6.2 一 元 线性 回归 分 析 


镀 阅读 专栏 6-1 
“回归 ”名 称 的 由 来 


回归 分 析 起 源 于 生物 学 研究 ， 是 由 英国 生物 学 家 兼 统计 学 家 弗朗西斯 。 高 尔 顿 (Francis Galton 
1822 一 1911) 在 19 世纪 未 研究 遗传 学 特性 时 首先 提出 来 的 。 为 了 研究 父 代 与 子 代 身 高 的 关系 ， 高 尔 顿 搜 
集 了 1078 对 父亲 及 其 儿子 的 身高 数据 。 他 发 现 这些 数 据 的 散 点 图 大 致 呈 直 线 状 态 ， 也 就 是 说 ， 总 的 趋势 
是 父亲 的 身高 增加 时 ， 儿 子 的 身高 也 倾向 于 增加 。 但 是 ， 高 尔 额 对 试验 数据 链 行 了 深入 的 分 析 ， 发 现 了 
一 个 很 有 趣 的 现象 一 一 回归 效应 。 因 为 当 父亲 高 于 平均 身高 时 ， ed ten 
比 他 更 类 的 概率 当 父 来 类 于 平均 身高 时 ， 他 的 儿子 的 身高 比 他 更 证 风流 率 要 小 于 比 他 更 高 的 概率 。 
反 哆 了 一 个 规律 ， 即 这 两 种 身高 父亲 的 儿子 的 身高 ， 有 疝 他 人 ROOT ea 
般 结论 的 解释 是 ， 大 自然 具有 一 种 约束 力 ， Es 稳定 而 不 产生 两 极 分 化 ， 这 就 是 所 谓 
的 回归 效应 。 高 尔 顿 依 试验 数据 还 推算 出 儿子 身高 际 身 高 (X) 的 关系 式 Y=a 十 bX， 它 代表 
的 是 一 条 直线 称 为 回归 直线 ， 和 归 分 析 。 高 尔 顿 在 1889 年 发 表 的 著作 《自然 的 
遗传 》 中 ， 提 出 了 回归 分 析 方法 以 后 AN 应 用 到 经 济 领域 中 来 ， 而 且 这 一 名 词 也 一 直 为 生 
物 学 和 统计 学 所 沿用 ， 


资料 来 源 ， 何 哎 群 等 。 wi ra 2002. 
6.2.1 A 


edd 基地 告诉 我 介 NS 以 及 相关 程度 是 否 密 
切 ， 在 此 基 而 进一步 揭示 变量 | [的 变动 规律 ， 则 是 相关 分 析 本 身 不 能 解决 的 问 
题 。 回 归 分 析 我 们 解决 了 这 个 难题 ， 通 过 回归 分 析 ， 建 立 起 了 变量 间 的 数学 表达 式 ， 
进而 确定 一 个 或 几 个 变量 的 变化 对 另 一 个 特定 变量 的 影响 程度 。 

1. 回归 分 析 的 含义 

所 谓 回归 分 析 (Regression Analysis) ， 就 是 在 分 析 变 量 之 间 相 关 关 系 的 基础 上 ， 进 一 
步 考察 变量 之 间 的 数量 变化 规律 ， 并 通过 回归 方程 (Regression Equation) 的 形式 加 以 描 
述 和 反映 变量 之 间 的 关系 ， 帮 助人 们 准确 把 握 变 量 受 其 他 一 个 或 多 个 变量 影响 的 程度 ， 进 
而 为 控制 和 预测 提供 依据 。 回 归 分 析 主 要 涉及 两 类 变量 ， 一 类 是 解释 变量 ， 也 称 为 因 变 量 
(Dependent Variable) ， 记 为 Y;， 另 一 类 是 被 解释 变量 ,也 称 为 自 变量 (Independent Vari- 
able) ， 记 为 Xi ，X2 ，…，X, 。 回 归 分 析 正 是 要 建立 了 Y 关于 Xi，Xs，…，X, 的 回归 方 
程 ， 并 在 给 定 Xi ，Xz ，…，X, 的 条 件 下 ， 通 过 回归 方程 来 预测 Y 的 平均 值 。 
归 分 析 与 相关 分 析 既 互相 补充 、 密 切 联系 ， 又 存在 本 质 的 区 别 。 首 先 ， 相 关 分 析 需 
要 回归 分 析 来 表明 变量 间 的 具体 联系 ， 而 回归 分 析 应 该 建立 在 相关 分 析 的 基础 上 ， 通 过 相 
关 分 析 确 定 了 变量 相关 后 ， 再 进行 回归 分 析 才 有 意义 。 其次， 回归 分 析 研 究 的 是 相关 关系 
中 的 因果 关系 ， 自 变量 和 因 变 量 的 地 位 不 同 ， 变 量 互 换 位 置 后 ， 回 归 方 程 就 发 生变 化 ;而 
相关 分 析 研 究 的 既 包括 因果 关系 ， 也 包括 共 变 关系 ， 变 量 互 换 位 置 后 ， 相 关系 数 不 变 。 
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2. 回归 分 析 的 分 类 

按照 不 同 的 分 类 方法 ,可 以 将 回归 分 析 划 分 为 多 种 类 型 。 根 据 所 处 理 的 自 变量 的 个 
数 ， 可 将 其 划分 为 一 元 回归 分 析 和 多 元 回归 分 析 。 如 果 研 究 的 是 一 个 自 变 量 与 因 变 量 之 间 
的 关系 ， 则 称 为 一 元 回归 分 析 ; 如 果 研 究 的 是 两 个 或 两 个 以 上 自 变量 与 因 变 量 之 间 的 关 
系 ， 则 称 为 多 元 回归 分 析 。 根 据 所 建立 的 回归 方程 的 形式 ， 可 将 其 划分 为 线性 回归 分 析 和 
非 线性 回归 分 析 。 线 性 回归 分 析 是 回归 分 析 最 基本 的 内 容 ， 而 一 元 线性 回归 分 析 又 是 线性 
回归 分 析 的 基础 。 因 此 ， 本 章 重点 讨论 一 元 线性 回归 分 析 的 问题 。 


6.2.2 一 元 线性 回归 模型 























1, 一 元 线性 回归 模型 的 建立 1 和 

设 因 变 量 为 Y， 自 变量 为 X， 对 于 X 的 不 全 相同 的 取 值 4 ,Nz ， 得 到 了 的 个 
对 应 的 观测 值 wm ,ys,…,y,， 这 对 观测 值 可 记 为 《zyay393Y 训 ,yo)，…, (zy,)。 我 们 
的 目的 是 从 这 对 观测 值 中 寻求 自 变量 XX 和 变 基因 次 安 间 的 关系 和 变动 规律 。 

首先 夯 出 两 个 变量 X 和 YY 的 散 点 图 ， AS-、 
即 把 (ziyiD)G 一 1,2,…,2) 标 在 直角 坐标 X| 人 x 
系 中 ， 如 图 6.4 所 示 。 若 这 个 散 点 呈 音 线 ~、 
趋势 ， 则 认为 了 与 X 的 关系 是 线性 相关 闫 
系 。 此 时 ，Y 和 X 的 关系 可 以 用 袜 完 线性 











回归 模型 来 表示 。 YA > 
建立 一 元 线性 回归 模型 Na 
Y= 车 bX 外 e (6-5y DY 


式 中 ， 因 变量 立 的 变 外 可 由 两 部 分 来 解 莉 忆 一 ”图 9.4 国 变量 Y 和 自 变量 X 的 散 点 图 
一 部 分 是 由 自 姿 若 X 的 变化 引起 的 Y 的 线 
性 变化 部 分 ， 即 =a 十 bX 另 一 部 分 是 由 于 其 他 随机 因素 引起 的 的 变化 部 分 ， 即 e。 
由 此 可 以 看 出 ,一 元 线性 回归 模型 是 因 变 量 Y 和 自 变量 X 之 间 的 非 一 一 对 应 的 统计 关系 
的 良好 诠释 ， 即 当 X 的 值 给 定 后 , Y 的 值 并 非 唯一 ， 但 它们 之 间 又 通过 a 和 2 保持 着 密切 
的 线性 关系 。a、5 为 回归 模型 中 的 待定 参数 ,a 为 回归 常数 , b 为 回归 系数 
(Regression Coefficient); e 为 随机 误差 . 它 是 一 个 随机 变量 ,一 般 假 设 s 一 时 回 
NCO,o)。 
对 于 每 个 观测 值 (zi ,y )， 根 据 公 式 (6 -5) 应 满足 : 回 
yi=atbzite; (6 - 6) 【期 刊 推荐 】 
式 中 ，s; 表 示 第 i 次 观测 的 随机 误差 .ei 一 N(0,0?)， 且 各 6; 相互 独立 , i 二 1,，2,…,n。 
2. 一 元 线性 回归 方程 的 建立 
在 回归 模型 (6 -5) 中 , X 是 一 般 变量 ， 可 以 严格 控制 和 精确 测量 ; Y 为 随机 变量 。 
对 公式 (6 一 5) 两 端 取 数 学 期 望 ， 即 得 一 元 线性 回归 方程 : 
E(Y)=atbX (6-7) 
式 中 ,a 和 是 待定 参数 ，2 为 回归 系数 ， 它 表示 自 变量 X 每 变化 一 个 单位 ， 因 变量 了 的 
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平均 变化 量 。 由 于 总 体 参数 a 和 4 是 未 知 的 ， 因 此 必须 利用 样本 观测 值 去 估计 它们 。 估 计 
的 回归 方程 为 
Y=a+)X (6-8) 
或 
六 一 6 十 pr i=1,2,.,n) (6—9) 


6.2.3 参数 的 最 小 二 乘 估计 


根据 散 点 图 6.4， 我 们 可 以 做 出 很 多 条 直线 来 表示 两 个 变量 之 间 的 线性 关系 究竟 
哪 条 直线 效果 最 好 呢 ? 我 们 想到 找 出 距离 观测 值 的 各 个 点 平均 来 说 最 近 的 那 条 直线 ， 根 据 
这 个 原则 来 确定 回归 直线 方程 中 的 待定 参 
数 4 和 8， 这 种 确定 欧 数 的 方法 称 为 最 小 二 

乘法 (Met MGSSCL east Squares) 。 
= 乘法 就 是 使 实际 观测 
As er 之 间 的 
差 前 平方 和 取 最 小 值 ， 即 要 选择 的 参数 6 

NA 应 满足 使 残 差 平方 和 ; 


、、\ 





























9 加 SR Si 广 )2 一 -Do —4—bzri)? 
TS i 
VX ;3 > (6-10) 
图 6.5 最 小 污 乘法 原理 Vn 。 最 小 二 乘法 原理 如 图 6. 5 所 示 。 
< ey 为 此 ， 分 别 令 SSE 对 4 入 的 偏 导数 
| 


等 于 0， 即 NS 2 


20558 350y =2 be).=0 
Ses 











a 
本 ， (6-11) 
SS 2 他 bri)z; 0 
ab Fer 
整理 得 方程 组 : 
nd + hx; = Dy 
0 (6.=12) 
Dz th = Dry; 
i=1 i 一 1 i=l 
称 此 方程 组 为 正规 方程 组 。 
解 此 正规 方程 组 .得 
hy 
b= 
”Su (6—13) 












































出现 国 己 蝎 


配合 最 佳 的 回归 直线 模型 的 条 件 

为 使 配合 的 直线 模型 最 佳 ， 应 当 遵循 下 列 条 件 ， 

(1) 两 个 变量 之 间 确 实 存在 显著 的 相关 关系 。 人 险 
(2) 两 个 变量 之 间 确 实 存在 直线 相关 关系 。 《 

5 配合 一 元 线性 回归 模型 


& 


nina 








学 生 编 号 UY 3 


4 








统计 学 成 绩 Y » oN yl 82 81 上 8 96 67 90 78 58 


pe 和 
试 求 统计 学 丝 送 成绩 Y 对 于 高 等 数学 汗 成 绩 X 的 回归 方程 。 
解 : (1) 绘制 散 点 图 ， 如 图 6.6 所 示 。 





5 

高 等 数学 成 绩 X 86 |¥90% | 79 76 x % 68 87 76 60 
? 
1 
































100r 


soL o oo 


统计 学 


70r 


60r 


sor 











60 70 0 90 100 
高 等 数学 
图 6.6 高 等 数学 和 统计 学 考试 成 绩 的 散 点 图 
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由 散 点 图 6. 6 可 以 初步 判断 高 等 数学 考试 成 绩 X 与 统计 学 考试 成 绩 Y 之 间 为 线性 相 
关 关 系 。 
(2) 设 直 线 回归 方程 为 =6 十 bX， 计算 &、8， 如 表 6-5 所 示 。 














表 6-5 6 和 的 辅助 计算 表 




















学 生 编号 高 等 数学 成 绩 X 统计 学 成 绩 了 中 4 
1 86 81 7396 6561 6966 
b 90 91 8100 8281 8190 
3 79 82 6241 6724 6478 
4 76 81 5776 6561 6156 
5 83 81 6889 > 6561 6723 



































9 76 78 二 5776 6084 5928 
10 60 2 改天 六 3600 3364 3480 
合计 801 SN 65187 65941 65523 


























==1 042. 5/1026. 921. 0152 


A=5y—bz=805/10—1. 0152X 801/10~—0. 8175 
故 回归 方程 为 


Y=—0. 8175 十 1. 0152X 
6.2.4 一 元 线性 回归 的 统计 检验 


在 前 面 的 讨论 中 ,我 们 首先 通过 散 点 图 来 初步 判断 两 个 变量 是 否 存在 线性 相关 关系 ， 
在 此 基础 上 建立 线性 回归 模型 ， 得 出 估计 回归 方程 。 由 于 该 方程 是 根据 样本 数据 得 出 的 ， 
此 它 是 否 真实 地 反映 了 自 变 量 X 和 因 变 量 Y 之 间 的 关系 .需要 通过 检验 后 才能 够 证 实 。 
.回归 方程 的 拟 合 优 度 检 验 
器 归 方 程 的 拟 合 优 度 检验 用 于 检验 样本 观测 点 与 回归 直线 的 接近 程度 。 如 果 各 观测 点 
聚集 在 回归 直线 附近 ， 则 说 明 回归 直线 对 观测 值 的 拟 合 程度 好 ， 从 而 评价 回归 方程 对 样本 
数据 的 代表 程度 高 ， 用 回归 方程 对 实际 问题 进行 分 析 和 预测 的 效果 好 。 
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判决 系数 〈Coefficient of Determination) 是 说 明 回 归 直 线 拟 合 程度 的 一 个 度量 值 ， 它 


的 引入 是 从 离 差 平 方 和 的 分 解 人 手 的 。 
(1) 离 差 平方 和 的 分 解 。 总 离 差 平 方 和 (Total Sum of Squares) : 


SST = 2 9, —7)? 
i=1 








总 离 差 平方 和 是 因 变 量 Y 的 实际 观测 值 与 其 均值 的 离 差 (y; 一 y) 的 平方 和 ， 


了 YY 的 n 次 实际 观测 值 之 间 的 全 部 差异 性 。 
可 归 平方 和 (Regression Sum of Squares) ; 





SSR = > ( 方 一 习 ? 
i=1 








自 变量 X 的 不 同 取 值 变化 对 因 变 量 Y 的 线性 影响 。 NS 
剩余 〈 残 差 ) 平方 和 (Residual Sum of Squares 六 一 


SSE = 各 


剩余 平方 和 是 因 变量 ra 








与 理论 回归 值 的 离 差 (yw 一 你) 的 

它 反映 了 除 自 变量 X 以 外 的 其 人 未 (如 时 
X 对 Y 的 非 线 性 影响 、 测 贡 误 器 侍 ) 对 因 变 方 
量 Y 的 影响 。 > 


(6-17) 
它 反映 


(6 一 18) 


可 归 平 方 和 是 因 变 量 Y 的 理论 回归 值 与 其 均值 的 离 差 (3 sermm 它 反映 了 


(6= 19) 





-XK 
可 以 证 明 ， Adin 站 
总 高 平方 和 各 时 平方 和 十 秋 余 平方 区 
即 离 差 平方 和 的 分 解 公 \ 式 为 
SST 一 SSR 十 SSE 《6 一 20)》 











离 差 平方 和 分 解 如 图 6. 7 所 示 。 wh 

(2) 离 差 平 方 和 的 计算 。 由 于 按 公 
式 (6-17) 一 公式 (6-19) 计算 3 个 离 差 平 
方 和 太 麻 烦 ， 因 此 可 以 对 其 进行 整理 得 到 
较 简 便 的 计算 公式 。 


SS Do DD = Sw D1 ! (Py) 
1 (3)) 


i=1 








图 6.7 离 差 平方 和 分 解 














SSR = > ( 信 一 让 2 一 户 S = (>4 
i=1 


SSE = D)(y,— 8%)? 一 SST 一 SSR 
i=1 


(3) 判 决 系数 。 将 离 差 平方 和 分 解 公式 两 边 同 除 以 SST ,得 


SSR , SSE 
SST SST 


TY 


《6 一 21) 


《6 一 22) 


(6 -23) 


(6 一 24) 
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显然 ， 各 个 实际 观测 点 越 是 聚集 在 回归 直线 附近 ，SSk 在 SST 中 所 占 的 比例 就 越 大 ， 
归 直 线 拟 合 的 就 越 好 。 我 们 将 这 一 比值 定义 为 判决 系数 ， 记 为 R? 。 
判决 系数 公式 为 





日 











BR -= SST 


回 zaog 回 。 式 中 ，R: 取 值 在 0 至 1 之 间 ，R2 越 接近 于 1， 表明 回归 方程 对 实际 观测 值 的 
拟 合 优 度 越 高 ，R? 越 接 近 于 0， 表 明 回 归 方程 对 实际 观测 值 的 拟 合 优 度 越 

回 低 。 在 一 元 线性 回归 分 析 中 ， 判 决 系数 也 是 简单 相关 系数 的 平方 ， 因 此 它 的 
【拓展 案例 】 ”统计 意义 与 简单 相关 系数 是 一 致 的 。 

2) 估计 标准 误差 

估计 标准 误差 (Standard Error of the Estimate) 是 是 从 另 一 个 除 可 归 直 线 拟 合 
程度 的 度量 值 ， 它 的 引入 是 从 剩余 〈 残 差 ) 平方 和 SSE 人 手 的 -下 

我 们 前 面 所 得 到 的 回归 方程 ， 是 根据 最 小 二 a RS 和 SSE 取 最 小 值 确 定 
的 。 因 此 ，SSE 值 的 大 小 ， 是 评价 回归 方程 拟 合 优 度 个 标准 ， 它 是 衡量 除 自 变量 X 
对 因 变 量 Y 的 线性 影响 以 外 ，Y 关机 六 动 大 小 的 从 计 值 。 其 值 小 ， 说明 实际 观测 点 平 
均 距 回归 直线 近 ， WE 由 此 ， 我 们 得 到 如 下 的 信 


计 标 准 误差 公式 : 
| > XY EE 4、 (6 — 26) 
【 例 6.3】 在 例 6. 2 上, 计算 判决 系数 及 竺 计 慰 准 误差 。 
解 : (1) 计算 关头 订 作 w 轩 鲍 ee Sz: =1026. 9, $=1.0152, 


Sy SA 1 1 (> :并 65941 一 0. 1 x 805? = 1138.5 
NA 
入 i 5 


SSR 一 2S =1.0152: X1026. 9~1058. 355 


_SSR_1058. 355 
SStr 1138.5 


R? 守 0. 9296 ,表明 估计 回归 方程 解释 了 总 离 差 的 92.96%, 即 在 统计 学 考试 成 绩 的 变动 
中 ,有 92.96% 是 由 高 等 数学 的 考试 成 绩 所 决定 的 。 可 见 ,统计 学 考试 成 绩 与 高 等 数学 的 考 
试 成 绩 有 比较 强 的 线性 关系 。 
(2) 计算 估计 标准 误差 。 
SSE 一 SST 一 SSR 一 1138. 5 一 1058. 355 一 80. 145 


ey Er BO 4s. 1651 


63. 1651, 表 明 根 据 高 等 数学 eh a 平均 的 预测 误 
差 是 3. 1651。 

2. 回归 方程 的 显著 性 检验 一 下 检验 

回归 方程 的 显著 性 检验 ,是 检验 因 变 量 Y 和 自 变量 X 之 间 的 线性 关系 是 否 显著 , 它 的 


(6 一 25) 















































0. 9296 
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基本 出 发 点 与 拟 合 优 度 检验 非常 相似 。 检 验 的 步骤 如 下 : 

01) 提出 假设 ,HH, :线性 关系 不 显著 ;Hi :线性 关系 显著 。 

(2) 构 造 检 验 统计 量 。 回 归 方程 的 显著 性 检验 采用 方差 分 析 的 方法 来 构造 检验 统计 量 。 
在 离 差 平方 和 分 解 公式 SST 一 SSR 二 SSE 中 ,对 于 一 个 具体 实验 来 说 ,SS+ 是 一 个 定 值 ,如 果 
SSk 远 大 于 SSE, 则 表示 因 变量 Y 和 自 变量 X 之 间 的 线性 关系 显著 ;否则 , 便 认为 线性 关系 
不 显著 。 

当 ,为 真 时 ,检验 统计 量 rs 


(3) 给 定 显著 性 水 平 a， 查 表 确 定 临界 点 F。(1,n 一 2)。 

(4) 确定 拒绝 域 : F 宇 F, (1,n 一 2)。 

(5) 列 出 方差 分 析 表 ， 做 出 统计 决策 。 如 果 检 验 统计 量 的 值 P>F。(1,n 一 2)， 则 拒绝 
Ho。， 认 为 因 变 量 Y 和 自 变量 X 之 间 的 线性 关系 显著 ; 反之 , 就 这 为 线性 关系 不 显著 。 方 





Pn—2) 
































差分 析 表 如 表 6 -6 所 示 。 < 
表 6-6 方差 分 析 表 一 一 
。 方 尖 来 滨 ”| 平方 和 | 自由 度 |、 均 广 基 |  F 信 | 旦 车 性 
回归 平方 和 SSR n pa | »\VR=SSRk F=VER/VE 
剩余 平方 和 SSE S Ve=SSE/n—2 
总 平方 和 SS Vw St 
~> gr Sg wx 
3， 回归 系数 的 显著 性 检验 全 一 ! 检验 wT 
i ei 的 影响 是 否 显著 。 如 果 总 


体 相关 系数 5 二 0 总 体 回归 下 线 是 一 条 水 于 线 ， 表明 自 变量 X 的 变化 对 因 变 量 Y 没有 影 
响 。 因 此 ， Ek 数 的 显著 性 检验 就 是 检验 向 归 系 数 6 与 0 之 间 是 否 有 显著 差异 。 检 验 的 
步骤 如 下 : 

(1) 提出 假设 ，Ho。 :b=0; 万 :0 天 0。 

(2) 构造 检验 统计 量 。 


当 Ho 为 直 时 ， 检 验 统计 量 为 (一 人 VS ~i(n—2) 


(3) 给 定 显 著 性 水 平 a， 查 表 确 定 临 界 点 ts (n 一 2)。 
(4) 确定 拒绝 域 . |1| 写 ts (n 一 2)。 


(5) 做 出 统计 决策 ， 当 |i| 三 ts (n 一 2) 时 ,拒绝 H。， 认 为 自 变量 处 对 回首 营 回 
因 变 量 Y 的 影响 显著 ， 反 之 ， 就 认为 自 变量 X 对 因 变 量 Y 的 影响 不 显著 。 2 
需要 说 明 的 是 ， 在 一 元 线性 回归 分 析 中 ,回归 方程 的 显著 性 检验 等 价 于 ”加 
回归 系数 的 显著 性 检验 ， 对 实际 问题 进行 分 析 时 ， 两 者 只 做 其 一 即 可 。 【拓展 案例 】 
【 例 6.4】 在 例 6.2 和 例 6. 3 的 基础 上 ， 试 进行 回归 方程 的 显著 性 检验 和 回归 系数 的 
显著 性 检验 。(c 一 0. 05) 
解 : (1) 回归 方程 的 显著 性 检验 。 
第 一 步 : 提出 假设 ,Ho 为 线性 关系 不 显著 ,Hi 为 线性 关系 显著 。 
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SSR/1 


第 二 步 : 计算 检验 统计 量 F 一 5557O 二 人， 列 出 方差 分 析 表 。 


表 6-7 方差 分 析 表 


























方差 来 源 平方 和 自由 度 均 方差 | 下 值 显著 性 
回归 平方 和 1058. 355 1 1058. 355 | 
剩余 平方 和 80. 145 8 | 10. 0181 | 

总 平方 和 1138.5 


第 三 步 :做 统计 决策 。 由 于 下 二 Fo.05(1,8) 二 5. 32， 因 此 拒绝 H。， 认 为 统计 学 考试 成 
绩 与 高 等 数学 考试 成 绩 的 线性 关系 显著 。 r 
(2) 回归 系数 的 显著 性 检验 。 从 
第 一 步 : 提出 假设 ， 瑟 ,为 4 一 0， 刀 为 4 天 0。 














第 二 步 : 计算 检验 统计 量 :一 全 /5 3 T02010. 2785, 
第 三 步 ， 做 统计 决策 。 ee 因此 拒绝 H。， 认 为 高 等 数学 考试 成 
绩 对 统计 学 考试 成 绩 有 显著 的 影响 人 
NS 
6 2.5 利用 加 骨 广 各 进行 项 测 NAN 


WR 如 果 回 上 Was 同时 被 证 明 有 
较 高 的 拟 合 ee en: 所 谓 预 测 器 是 指 通过 自 变量 X 的 取 值 估计 或 
We 全 提 主 要 介绍 根据 估计 辐 昌 方 各 进行 的 点 预测 和 区 间 矣 测 方法 。 


点 预测 x 红 
J 
Pe Nh 于 自 变量 X 的 一 个 新 的 给 定 值 x。， 根 据 估计 回归 方程 得 到 因 变 量 Y 的 
一 个 估计 值 ， 即 在 X=zo 处 ，Y 的 点 预测 值 为 
Yo =A+bro (6-27) 
由 于 点 预测 不 能 给 出 估计 的 精度 ， 即 点 预测 值 w 与 实际 值 w 之 间 是 有 误差 的 ， 因 此 
在 对 Y 的 实际 值 进行 预测 时 ,通常 是 在 一 定 的 显著 性 水 平 下 ， 给 出 其 置信 水 平 为 1~a 的 
置信 区 间 ， 这 就 是 区 间 预 测 。 
2. 区 间 预 测 
区 间 预 测 就 是 对 于 自 变 量 X 的 一 个 新 的 给 定 值 z。， 根据 估计 回归 方程 得 到 因 变 量 Y 
一 个 置信 水 平 为 1~“ 的 置信 区 间 。 
在 X=zo 处 , Y 的 置信 水 平 为 1~a 的 置信 区 间 为 






































(一 
[= i | (6-28) 
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利用 回归 直线 方程 进行 预测 需要 注意 的 问题 
回归 直线 方程 是 根据 自 变量 和 因 变 量 的 实际 观测 值 的 实际 影响 数值 配合 出 来 的 ， 因 此 ， 在 所 观察 到 
的 自 变 量 最 大 值 与 最 小 值 之 间 进 行内 推 预测 较为 适宜 。 若 要 进行 外 推 预测 ， 则 意味 着 假设 自 变量 对 因 变 
量 的 影响 作用 仍然 不 变 ， 这 可 能 会 与 实际 情况 不 符 ， 因 此 在 进行 外 推 预测 时 ， 自 变量 的 给 定 值 与 观察 的 
最 大 值 (或 最 小 值 ) 之 间 的 差距 越 小 越 好 。 


【 例 6.5】 在 例 6. 2 中 ， 如 果 估 计 某 学 生 的 高 等 数学 考试 成 绩 是 85 分 ， 试 根据 估计 回 
归 方程 对 其 统计 学 考试 成 绩 进 行 点 预测 和 区 间 预 测 。(c 一 0.05) 
解 : (1) 点 预测 。 
由 例 6. 2， 舍 计 回归 方程 为 < 
Y= 一 0. 8175 十 1. 0152 
此 ， 当 高 等 数学 考试 成 绩 xo 二 85 时 ， 统计 学 考 流 吉 人 Os 


= 一 0. 8175 十 1. 0152xo wi H+1.0152X 85285 
即 高 等 数学 考试 成 绩 为 85 分 的 那个 学 生 学 考试 成 绩 估 计 约 为 85 分 。 



































(2) 区 间 预 测 。 

由 例 6.2，Sv 一 1026.9; Da sh 当 a= 0; 05, 查 表 得 t0.025 (8) 一 2. 752。 
因此 ， 当 高 等 数学 考试 成 绩 立 SN 时 ,统计 学 考 记 区 间 估计 值 为 
| 
| 
1026.9 






| bzo 5 


vb +2.752 X 3， eb 
i 


也 就 是 说 ,我 们 能 以 95% 的 概率 推断 ， 高 等 数学 考试 成 绩 为 85 分 的 那个 学 生 ， 他 的 
统计 学 考试 成 绩 在 76 一 94 分 。 


您 阅读 案例 6-2 





宝丽来 公司 利用 回归 分 析 调整 生产 


1947 年 ， 宝 丽 来 公司 创始 人 埃 德 文 。 兰 德 博士 (Dr. Edwin Land) 宣布 ， 他 们 在 研究 即时 显 像 技术 
方面 到 出 了 新 的 一 步 ， 使 一 分 钟 成 像 成 为 可 能 。 紧 接着 ,公司 开始 拓展 用 于 大 众 摄影 的 业务 。 宝 丽 来 的 
第 一 台 相 机 和 第 一 卷 胶卷 诞生 于 1949 年 。 在 那 以 后 ,公司 不 断 地 在 化 学 、 光 学 和 电子 学 方面 进行 试验 和 
发 展 ， 以 生产 具有 更 高 品质 、 更 高 可 靠 性 和 更 为 便利 的 摄影 系统 。 

宝丽来 公司 的 另 一 项 业务 是 为 技术 和 工业 提供 产品 。 它 正 致力 于 使 即时 显 像 技术 在 现代 可 视 的 通信 
环境 下 ， 成 为 日 益 增长 的 成 像 系 统 中 的 关键 部 分 。 为 此 ， 宝 丽 来 公司 推出 了 多 种 可 进行 即时 显 像 的 产品 ， 
以 供 专业 摄影 、 工 业 、 科 学 和 医学 之 用 。 除 此 之 外 ， 公 司 还 在 磁 学 、 太 阳 镜 、 工 业 偏 振 镜 、 化 工 、 传 统 
的 涂料 和 全 息 摄 影 的 研制 和 生产 力 方面 有 自己 的 业务 。 

用 于 衡量 摄影 材料 感光 度 的 测 光 计 ， 可 以 提供 许多 有 关于 胶片 特性 的 信息 ,如 它 的 曝光 时 间 范 转 
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在 宝丽来 中 心 感光 实验 室 中 ,科学 家 们 把 即时 显 像 胶 片 置 于 一 定 的 温度 和 湿度 下 ,使 之 近似 于 消费 者 购 
买 后 的 保存 条 件 。 然 后 ， 再 对 其 进行 系统 地 抽样 检验 和 分 析 。 他 们 选择 专业 彩色 摄影 胶卷 ， 抽取 了 已 保 
水 朋 不 轩 隐 几 ， 以 便 研 究 它们 保存 时 间 和 感光 速率 之 间 的 联系 。 它 们 之 间 相 应 变动 的 关系 可 
用 一 条 直线 或 线性 关系 近似 地 表示 。 

运用 回归 分 析 ， 宝 丽 来 公司 建立 起 一 个 方程 式 ， 它 能 反映 出 胶卷 保存 时 间 长 短 对 感光 速率 的 影响 

3 一 一 19. 8 一 7. 6z 

式 中 ，y 为 胶卷 感光 速率 的 变动 ; 工 为 胶卷 保存 时 间 (月 )。 

从 这 一 方程 式 可 以 看 出 ， 胶 卷 的 感光 速率 平均 每 月 下 降 了 7.6 个 单位 。 通 过 此 分 析 得 到 的 信息 ， 有 
助 于 宝丽来 公司 把 消费 者 的 购买 和 使 用 综合 起 来 考虑 ,调整 生产 ,提供 顾客 需要 的 胶卷 。 

资料 来 源 : 戴 维 。R. 安德森 ,丹尼斯 。J. 斯 威 尼 ， 托马斯 。A. 威廉 斯 .商务 与 经 济 统计 [MJ]. 张 
建华 ， 王 健 ， 冯 燕 奇 ， 等 译 . 北京 : 机 械 工业 出 版 社 ，2003. 


6.3 分 析 


在 许多 实际 问题 中 ， 还 会 遇 到 一 个 因 变 量 和 多 个 en 这 需要 用 多 
元 线性 回归 分 析 的 方法 来 解决 。 多 元 线性 回归 模 型 是 一 线性 回归 模型 的 扩展 ， 其 基本 原 

3 一 元 线性 回归 分 析 类 似 。 因 此 ， 本 节 对 下 者 相 类 似 的 内 容 ， 仅 给 出 结论 ， 而 对 于 某 
些 不 同 之 处 做 比较 详细 的 说 明 。 RA 人 > 


6.3.1 多 元 线性 回归 模型 与 5 AN 














六 
.多 元 线性 回归 模型 3 “ a 


(1 


x 
涉及 p 个 和 二 机 可 直 Rg ~ 
全 Y=bo tb Xi Ke bX +e (6 — 29) 


ee AN ， 满 足 e~N(0,.0?); Wl; 而 ,by，… ,bp 是 待定 参数 ,bo 为 回归 常数 ,6 
.为 偏 加 归 系 数 。 
对 于 每 个 观测 值 (zu zz,…',znsyi)， 根据 式 (6-29) 应 满足 : 


yi=bo thritborzit "tbprp te; (6— 30) 


式 中 ,si 表示 第 i 次 观测 的 随机 误差 . 满足 6; 一 N(0,02)， 且 各 &; 相 互 独立 ， 
【拓展 知识 】 i=],2,°" 7 











2. 多 元 线性 回归 方程 

多 元 线性 回归 方程 是 描述 因 变量 Y 的 平均 值 或 期 望 值 如 何 依赖 于 自 变量 Xi ,Xs，… 
XX, 的 方程 。 多 元 线性 回归 方程 的 形式 为 

E(Y)=bo 十 页 XI 十 02X2 十 … 十 DopXp KG 一 站] 

国 加 式 中 ,bo ,bi ,bs ,… ,6 是 待定 参数 ，b; 表 示 假 定 其 他 变量 不 变 ， 当 X; 每 变动 

|。 个 单位 时 ，Y 的 平均 变动 值 。 

由 于 总 体 参 数 名 , 广 .0s,… .6 是 未 知 的 ， 因 此 必须 利用 样本 观测 值 去 估 
计 它 们 。 估 计 的 多 元 线性 回归 方程 为 


























【拓展 知识 】 























相关 及 回归 分 析 
Y= + Xi th Xb XN, (6 一 32) 
或 
= 二 itr bprp Gi=1,2.% 7) (6— 33) 





WOO Oe 


偏 回 归 系 数 告 诉 我 们 什么 ? 
偏 回归 系数 表示 了 其 他 因素 不 变 时 ， 相 应 解释 变量 对 因 变 量 的 “ 净 影 








6.3.2 参数 的 最 小 二 乘 估计 














多 元 线性 回归 分 析 同 样 采用 最 小 二 乘法 来 估计 待定 参数 。 ea Bb bs 














满足 使 残 差 平方 和 SSE Do 及 7 Do SD … 一 bx)? 取 最 小 值 。 
根据 最 小 二 乘法 的 要 求 ， mn 下: 
3sse_0 A 
ap 


a Loy (6 —34) 


aSSes 
SN 
由 于 求解 上 述 方程 组 的 计算 过 程 入 烦 珊 ， 因此 eo 细 的 求解 介绍 。 我 们 可 以 借 
助 于 SPSS en Ww L 
6.3.3 多 元 线性 加 人 的 统计 检验 。 NA 
:~ 下 之- 
1 回归 良 福 的 机 全 化 度 检验 


1) 判定 系数 R: 及 修正 的 判定 系数 R? 
在 多 元 线性 回归 分 析 中 。 离 差 平方 和 的 分 解 公式 仍然 成 立 ， 即 SS 一 SSR 十 SSE。 其 中 ， 





= 一 y)? 为 总 离 差 平方 和 ， Sse= Do 一 7)? 为 回归 平方 和 , SSE = Do 
一 1 


为 性 余 平方 和。 

判定 系数 及 仍然 是 指 回 归 平 方 和 占 总 离 差 平方 和 的 比例 。 判 定 系 数 R? 的 计算 公式 为 
_SSR_| SSE 
一 SSr 一 1 SST (6 一 35) 





式 中 ，R? 取 值 为 0 一 1，R? 越 接近 于 1， 表 明 回 归 方 程 对 实际 观测 值 的 拟 合 优 度 越 高 ，R? 
越 接近 于 0 表明 回归 方程 对 实际 观测 值 的 拟 合 优 度 越 低 。 


OOO 


利用 R? 值 对 模型 贡献 的 直觉 判断 必须 小 心 
总 结 迄 今 为 止 的 讨论 ， 尽 2 的 值 是 预测 方程 拟 合 数据 好 坏 的 一 个 指标 。 更 重要 地 ， 它 可 以 用 来 〈 用 下 
统计 量 ) 确定 数据 是 否 提供 了 足够 的 证 据说 明 整 体 模型 对 预测 y 贡献 了 信息 。 然 而 ， 基 于 计算 的 R: 值 对 
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模型 贡献 的 直觉 判断 必须 小 心 。 随 着 越 来 越 多 的 变量 加 入 到 模型 中 ，R? 的 值 会 变 得 越 来 越 大 。 因 此 ,可 
以 强迫 R? 取 到 一 个 很 接近 于 1 的 值 ， 即 使 模型 对 y 的 预测 没有 贡献 信息 。 事 实 上 ， 当 模型 中 的 项 数 等 于 
数据 点 个 数 时 ，R: 将 等 于 1。 











修正 的 判定 系数 是 指 用 平均 剩余 平方 和 SSE 来 代替 SS ， 用 平均 总 离 差 平方 和 
31 来 代替 SSr， 进 而 得 到 修正 的 判定 系数 的 计算 公式 为 
B21_ SSe/(n—p—l) 


R:=1 (6 一 36) 


SST/ (一 1) 
式 中 , n 一 p 一 1 入 一 1 分 别 为 SSE 和 SSt 的 自由 度 ，R? 的 取 值 范围 和 意义 与 Rz 完 全 相 
同 。 在 多 元 线性 回归 分 析 中 ， 修 正 的 判定 系数 R? 比 判定 系数 R? 更 能 够 准确 地 反映 回归 方 
程 对 实际 观测 值 的 拟 合 程度 。 
2) 估计 标准 误差 




















在 多 元 线性 回归 分 析 中 ， 估 计 标 准 误差 仍然 是 允 a 个 估计 值 ， 
它 在 衡量 多 元 回归 方程 的 拟 合 合 优 度 方面 也 起 者 重要 的 作 ) 下 N 式 为 











《一 (6-37) 


2. 回归 方程 的 显著 性 检验 E 站 这- 


回归 方程 的 显著 性 检验 ， We ,Xs，… ,Xp 之 间 的 线性 关 
系 是 否 显 著 。 检 验 的 步骤 如 下 式 

(1) 提出 假设 ，H, 线 性 关系 不 显著 ,HI es. 

(2) 构造 检验 统计 量 ! : NS 

当 Ho 为 真 时 ，` 答 验 统计 量 为 经 

SSr/p 
SSE/(n—p—1) 

(3) 给 定 显著 性 水 平 a， 查 表 确 定 临 界 点 F,(p,n 一 p 一 1)。 

(4) 确定 拒绝 域 ，F 三 F,(p,n 一 p 一 1)。 

(5) 列 出 方差 分 析 表 ,做 出 统计 决策 。 如 果 检 验 统计 量 的 值 F 宇 FCp,n 一 p 一 1)， 则 拒 
绝 H。， 认 为 因 变 量 Y 和 所 有 自 变量 之 间 的 线性 关系 显著 ; 反之 ， 则 认为 线性 关系 不 显著 。 
方差 分 析 表 如 表 6 - 8 所 示 。 








F 





~F(p,n—p—1) 





表 6-8 方差 分 析 表 











方差 来 源 平方 和 自由 度 均 方差 下 值 显著 性 
回归 平方 和 SSR p Vr=SSr/p 下 一 VR/VF 
剩余 平方 和 SSE np VF=SSF/(n—p—1) 

总 平方 和 SST 

















3. 回归 系数 的 显著 性 检验 一 一: 检验 
如 果 下 检验 已 经 表明 了 回归 模型 总 体 上 是 显著 的 ,那么 回归 系数 的 检验 就 是 用 来 确定 
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一 个 单个 的 自 变量 X; 对 因 变 量 Y 的 影响 是 否 显著 。 在 多 元 线性 回归 中 ， 回 归 方 程 的 显 
著 性 检验 不 再 等 价 于 回归 系数 的 显著 性 检验 。 
检验 的 步骤 如 下 : 
(1) 提出 假设 ，Ho :bj 二 0; 万 :bj; 关 0。 
(2) 构造 检验 统计 量 。 
当 有 Ho, 为 真 时 ,检验 统 计量 为 


b 
团 = ~t(n—p—D) 























式 中 ，S# 是 回归 系数 色 的 抽样 分 布 的 标准 差 ， 即 
ES 
p> (zj — ZT )? 人 险 
(3) 给 定 显著 性 水 平 <， 查 表 确 定 临 办 点 “如 CY 
(4) 确定 拒绝 域 ， 
fil 和 RN 【期 刊 推荐 】 


(5) 做 出 统计 决策 ， 当 |7| 三 4 ee ) 拒绝 HH,， 认 为 XX; 对 因 变 量 Y 的 影响 
显著 ， 反 之 ， 就 认为 自 变量 X; 2 响 不 显著 。 


Cs 阅读 专栏 6-2 ES 疹 
4 a 
总 何 正确 进行 直线 相 分 疡 与 回归 分 析 

科研 中 ， 经 常 需要 中 光 两 个 变量 间 的 相互 ; NA 此 时 常用 的 做 法 就 是 进行 简单 直线 相关 
NA 贸 多 人 在 进行 统计 分 析 记 入 没有 考虑 实际 问题 盲目 套用 这 两 种 方法 ， 这 样 往 
往 接 盖 了 事物 的 本 痉 位 系 ， 得 出 与 实际 不 符 或 错误 的 结论 。 

1. 直线 相关 与 回归 分 析 的 异同 点 

不 同 点 : 

(1) 分 析 目 的 不 同 。 直 线 相关 分 析 的 目的 是 描述 具有 直线 关系 的 两 变量 间 相 关 关 系 的 密切 程度 和 方 
向 ,反映 两 个 随机 变量 的 相互 关系 。 直 线 回归 分 析 的 目的 是 定量 地 描述 两 个 变量 之 问 的 依存 或 依赖 关系 
以 便 用 一 个 变量 去 推测 另 一 个 变量 的 值 

(2) 资料 要 求 不 同 。 在 进行 直线 回归 分 析 时 ， 要 求 因 变量 了 是 随机 变量 且 服 从 正 态 分 布 ， 若 自 变 量 
处 可 以 精确 测量 或 严格 控制 ， 则 可 以 作为 回归 分 析 资 料 。 而 在 进行 直线 相关 分 析 时 ， 则 要 求 X、Y 两 个 
变量 均 为 随机 变量 且 服 从 正 态 分 布 

(3) 统计 量 量 纲 单位) 不同。 相关 系数 是 无 量 纲 的 计算 ,而 儿 率 b 却 是 有 量 岗 的 统计 量 ， 其 量 岗 
为 “ 因 变 量 量 纲 / 自 变量 量 纲 ”， 截 距 a 的 量 纲 与 因 变 量 量 纲 相同 。 

相同 点 : 

(1) 方向 一 致 。 对 某 资 料 同 时 计算 直线 相关 系数 上 和 直线 回归 系数 0， 可 发 现 它们 的 正 负 号 一 致 。 
为 正 ， 说 明 两 变量 间 的 相互 关系 是 同 向 变化 ; 六 为 正 ， 说 明 自 变量 X 每 增加 (或 减少 ) 一 个 单位 ， 因 变 
量 了 平均 增加 (或 减少 ) 已 个 单位 。 

(2) 假设 检验 等 价 。 对 于 同一 样本 ， 对 其 直线 相关 系数 和 直线 回归 系数 进行 假设 检验 所 得 到 的 + 
值 是 相同 的 。 
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2. 直线 相关 与 回归 分 析 的 关键 点 及 分 析 步 又 

在 进行 直线 相关 与 回归 分 析 时 ， 关 键 点 在 于 “结合 研究 目的 ， 选 择 合适 的 分 析 方 法 ”“ 明 确 是 否 有 专 
业 依 据 认为 两 变量 之 间 存 在 联系 ”“ 检 查 资料 是 否 满足 同 质 性 要 求 ”“ 绘 制 散 点 图 以 判断 两 变量 间 是 否 存 
在 线性 变化 趋势 "”“ 计 算 有 关 统 计量 并 对 其 进行 假设 检验 ”和 “给 出 与 实际 相符 的 专业 结论 "。 具 体 分 析 
步骤 四 根据 研究 目的 ， 判断 其 为 相关 问题 或 回归 问题 ， 从 而 选择 合适 的 分 析 方 法 ; 加 根据 专业 知识 ， 
确定 两 变量 之 间 是 否 存在 相互 关系 或 依存 关系 ; 回 结合 受 试 对 象 的 特点 ， 看 其 是 否 满足 同 质 性 要 求 
图 绘制 两 变量 变化 趋势 的 散 点 图 ， 以 便 选择 合适 的 统计 分 析 模 型 回 计算 相应 的 统计 量 ， 并 对 其 进行 从 
设 检验 ; 加 结合 专业 和 统计 学 知识 ， 判 断 结果 有 无 实用 价值 

3. 正确 进行 直线 相关 分 析 与 回归 分 析 

在 进行 直线 相关 分 析 与 回归 分 析 时 ， 常 犯 的 错误 包括 没有 专业 依据 ， 言 目 研究 变量 间 的 相互 关系 或 
依赖 关系 ; 未 绘制 反映 两 变量 变化 趋势 的 散 点 图 ， 直接 进行 直线 相关 分 析 或 直线 回归 分 析 ; 计算 出 相关 
系数 或 得 到 回归 方程 后 ， 没 有 对 其 进行 假设 检验 ， 就 认定 两 变量 之 问 存在 密 拒 相互 关系 或 依赖 关系。 最 
ee ee 
时 期 六 委 的 樟 品 的 数据 滴 在 一 起 可 能 训 不 同 质 了。 下 面 以 一 个 实测 党 甫 日 采 用 相关 分 析 或 回归 分 
析 产 生 的 后 果 。 2 

TT 
其 子 身高 ， 发 现 二 者 存在 直线 相关 关系 。 关 以 小 树 高 度 汶 生变 量 ， 以 其 子 身高 为 因 变 量 ， 得 到 二 者 的 直 
线 回归 方程 。 请 问 : 这 样 做 有 意义 吗 ? OK 

ee 要 求 待考 察 的 两 个 变量 之 问 存在 专业 上 的 联系 。 

入 


因为 任何 两 个 变量 构成 的 勾 计 贸 电能 求 出 相关 系数 和 回归 方程 ， 但 并 不 能 就 此 说 明 两 变 
加 武汉 回 量 之 同 存在 内 在 联系 1 更 汪 | 空 即 确定 它们 之 问 看守 关系 ， 这 很 可 能 只 是 一 种 伴随 关 
FE eae olde 毫 无 专业 依据 ， 这 样 的 计算 结果 


男 绝 属 “数字 游戏 < 没有 实际 意义 。 事 实生 ,小 及 身 高 与 时 间 存在 相关 关系 ， 而 小 树 高 度 与 
【拓展 案例 】 时 间 也 看 和 相关 其 系 。 因 此 ， 小 孩 身高 全 和 窟 度 存在 的 直线 相关 关系 只 是 一 种 表象 ， 是 


Cd ele nr 
资料 来 源 : 福 源 》 胡 良 平 ， 李 长 平 ， 等 .如何 正确 进行 直线 相关 与 回归 分 析 [J]. 中 西医 结合 学 报 


2008 (12): 1311~1314. 


6.4 非 线性 回归 分 析 


6.4.1 非 线性 回归 分 析 概 述 


在 实际 问题 中 ， 有 时 变量 之 间 的 关系 不 是 线性 关系 ,根据 专业 知识 或 从 散 点 图 中 散 点 
的 分 布 趋势 ， 可 以 看 出 是 某 种 类 型 的 曲线 关系 。 这 时 ， 可 以 选择 一 条 相近 的 函数 曲线 与 之 
拟 合 ， 这 就 是 非 线 性 回归 分 析 所 要 解决 的 问题 。 
对 于 非 线性 回归 问题 ， 一 部 分 可 以 转化 为 线性 回归 问题 来 求解 。 其 基本 过 程 是 先 对 非 
线性 回归 模型 进行 适当 的 变量 转换 ， 使 其 转化 为 线性 回归 模型 ， 然 后 对 转换 后 的 新 变量 进 
行 线性 回归 分 析 ， 采 用 最 小 二 乘法 建立 线性 回归 方程 ， 并 进行 统计 检验 ; 最 后 将 新 变量 还 
原 为 原 变量 ， 得 出 原 变量 的 曲线 回归 方程 。 

在 毫 无 专业 经 验 的 基础 上 ， 选择 相关 类 型 往往 是 比较 困难 的 。 一 个 可 行 的 方法 就 是 
在 绘制 散 点 图 的 基础 上 观测 实测 点 的 分 布 趋势 与 哪 一 类 已 知 的 函数 曲线 最 接近 ， 再 选 




















日 
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该 函数 关系 式 来 拟 合 实测 点 。 由 于 绘制 散 点 图 及 曲线 拟 合 的 过 程 比 较 烦 琐 ， 因 此 这 部 
分 内 容 建 议 用 SPSS 统计 分 析 软 件 求解 。SPSS 统计 分 析 软 件 为 我 们 提供 了 曲线 估计 
(Curve Estimation) 功能 ， 以 及 多 种 曲线 类 型 ， 并 能 够 自动 选择 模型 进行 拟 合 ， 同 时 完 
成 模型 的 参数 估计 ， 并 输出 判定 系数 及 回归 方程 检验 的 结果 ， 以 此 为 主要 依据 选择 其 中 
的 最 优 模型 。 






































6.4.2 非 线性 回归 模型 及 其 线性 化 方法 


下 面 介绍 几 种 常见 的 可 线性 化 的 非 线性 模型 。 
1. 双 曲 线 函 数 














对 于 双 曲 线 丙 数 喜 =a 十 专 ， 令 一 让，X 一 吉 ， 则 厅 御 他 六 本数 Ya FX 


2. 和 函 数 AS 


对 于 寡 函 数 Y 一 wX' (a 之 0)， RS Ina+blnX, 令 Y =InY, 
a 二 lna，X' 二 InX， 则 可 转化 为 线性 函数 Y” 


3. 指数 函数 
(1) 对 于 指数 函数 Y 一 we ( BD mann lny 一 Ina 十 5X， 令 了 一 
lnY，w' = 二 Ina， 则 a 一 ad 十 0X。 





SVX 
(2) 对 于 指数 函数 了 二 dd@ 沪 (a 二 0)， 车 两 边 竣 然 对 数 得 InY=lna+b/X, 令 Y'= 
lnY, a’=Ina, * NA +bX’。 
We 
4.。 对 数 函数 < 人 不 作 
对 于 对 数 函 数 Y 二 a 十 blgX， SX'=IgX, 则 可 转化 为 线性 函数 Y 一 < 十 OX 。 


5. Logistic 生长 函数 





对 于 Logistic 生长 函数 了 一 了 二 -x， 车 两 边 取 倒数 得 各 一 1 十 ae 个， 即 人 4 一 














ae- 必 ， 再 对 两 边 取 自然 对 数 得 In 和 一 lna 一 bX， 令 YIn 
则 可 转化 为 线性 函数 二 a 十 BX 

6.S 型 函数 

对 于 S 型 函数 Y= 若 两 边 取 倒数 得 二 一 4 十 bc， 人 SY. X= 
则 可 转化 为 线性 函数 Y= 二 a 十 bX'。 
7. 高 阶 函 数 
对 于 高 阶 函 数 Y 了 =bo 十 IX 十 bz X? 十 … 十 bX", 令 XI 一 X，Xe 一 X2 ，…，X 一 X"， 
则 可 转化 为 线性 函数 Y 了 ==bo 十 bi Xi 十 bz Xz 十 … 十 bnX，。 
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6.5 用 SPSS 统计 软件 进行 相关 及 回归 分 析 


6.5.1 相关 分 析 SPSS 软件 操作 步 又 


相关 分 析 SPSS 软件 操作 步骤 如 下 : 

(1) 选择 Analyze - Correlate - Bivariate 选项， 弹出 “Bivariate Correlations” 对 

(2) 把 参加 计算 相关 系数 的 变量 从 左 侧 列表 框 中 选 到 右 侧 的 “Variables” 列 表 框 中 。 

(3)“Correlation Coefficients” 选 项 组 选择 相关 系数 类 型 4 包含 3 个 复 选 框 。 

“Pearson” 复 选 框 : 简单 相关 系数 ， 是 系统 默认 的 方式 。 用 于 连续 变量 或 等 间距 测 
度 的 数值 型 变量 。 AN \ 

四 “Spearman” 复 选 框 ， 等 级 相关 系数 ， 用 来 度 施 册 到 变量 ， 

加 “Kendall's tau-b” 复 选 框 : 等 级 相关 及 来 度量 顺序 变量 。 

(4)“Test of Significance” 选 项 组 :， 过 多 和 出 相关 系数 检验 的 双边 或 单 边 概 率 卫 值 ， 

含 两 个 单 选 按钮 。 NA 

“Two- tailed” a ui, 和 和 用 于 事先 不 知道 相关 方 
向 的 情况 。 1 

©@ “One 一 tailed” 总 渤 拉 全 单 边 检验 ， 用 了 天光 广 向 的 情况 。 

(5) “Flag signifieani CErrelations” 复 选 杷 亏 选择 输出 “x* ”标志 ， 以 标明 变量 间 的 
相关 性 是 否 显 著 。 ;> 

在 相关 系数 用， * ” 标 出 检验 结 条， 户 * ”表示 显著 性 概率 P 过 0.05， 即 一 般 显 著 ; 
人 人 表示 显著 性 概 率 P 一 0.01， 即 特别 显著 。 

(6) 单 击 “Options” 按 钮 ， 弹 出 “Bivariate Correlations Options” 对 话 框 。 

@“Statistics” 选 项 组 : 选择 要 输出 的 统计 其， 包含 两 个 复 选 框 。 

a.“Means and standard deviations” 复 选 框 : 输出 变量 的 均值 和 标准 差 。 

b.“Cross -product deviations and covariances” 复 选 框 : 输出 各 对 变量 的 又 积 离 差 阵 
和 协 方差 阵 。 

@ Missing Values 选项 组 : 指定 对 缺失 值 的 处 理 方式 ， 包 含 两 个 单 选 按钮 。 

a. “Exclude cases pairwise” 单 选 按钮 : 剔除 本 计算 变量 含有 缺失 值 的 数据 。 

b. “Exclude cases listwise” 单 选 按钮 : 剔除 所 有 计算 变量 含有 缺失 值 的 数据 。 

@ 单 击 “Continue” 按 钮 ， 返 回 “Bivariate Correlations” 对 话 框 。 

(7) 单 击 “OK” 按 钮 ， 得 到 相关 分 析 输 出 结果 

【 例 6.6】〗 用 SPSS 统计 分 析 软 件 的 相关 分 析 功 能 ， 对 例 6. 1 中 城镇 居 
民 消 费 支出 与 人 均 可 支配 收入 进行 相关 分 析 。 

解 : 调用 SPSS 中 的 相关 分 析 功 能 ,得 到 城镇 居民 消费 支出 与 人 均 可 支 
【拓展 视 频 】 ” 配 收 入 的 相关 系数 及 显著 性 检验 输出 结果 如 表 6 一 9 和 表 6 一 10 所 示 。 
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表 6-9 基本 描述 性 统计 量 (Descriptive Statistics) 
Mean Std. Deviation N 
可 支配 收入 24. 00 9.67 16 
消费 支出 20. 93 9. 34 16 














从 表 6 -9 可 知 ， 参 与 分 析 的 两 个 变量 的 样本 数 都 是 16， 人 均 可 支配 收入 的 平均 值 是 
24 千 元 ， 标 准 差 是 9. 67 千 元 ; 城镇 居民 消费 支出 的 平均 值 是 20. 93 千 元 ， 标 准 差 是 9. 34 
千 元 。 





表 6-10 相关 系数 及 显著 性 检验 结果 (Correlations) 
































可 支配 收 2 消费 支出 

Pearson Correlation pe 0.969… 
可 支配 收入 Sig. (2— tailed) Ws 0. 000 

N 六 nn 16 

点 
Peaisoi Correlation No96o… 1 
AN 

消费 支出 Sig. (2— tailed) K> 0. 000 

N NY 16 16 

x* ，Correlation is significant at the OL lievel (2—tailed) > 





从 表 6 一 10 可 知 ， 城 镇 居民 消费 支出 OL nt 969， 双 边 检 

验 的 显著 性 概率 了 三 0. 0601 由 于 三 0.01， 说 大 城镇 居民 消费 支出 与 人 均 可 支配 收入 之 

间 呈 正 相关 关系 ， 季 和 关 性 特别 显著 ， 因 此 沁 在 粗 关系 数 0. 969 旁边 以 “** ”进行 标志 。 
> 


6.5.2 线性 回归 分 析 SPSS 软件 操作 步 骂 


线性 回归 分 析 SPSS 软件 提供 了 多 种 回归 分 析 方 法 ,输出 的 结果 也 比较 多 ， 此 处 只 介 
绍 与 前 面 内 容 相关 的 统计 分 析 功 能 。 

(1) 选择 Analyze>Regression 习 Linear 选项 ， 弹 出 “Linear Regression” 对 话 框 。 

(2) 将 因 变 量 放 入 “Dependent” 框 ,将 一 个 或 多 个 自 变 量 放 和 人 人 “Independent 
(sy” 框 。 

(3) 在 “Method” 框 中 ,选择 回归 分 析 方法 。 可 以 选择 系统 默认 的 强行 进入 方法 
(Enter)， 即 所 选择 的 自 变量 强行 进入 回归 方程 。 

(4) 单 击 “Statistics” 按 钮 ， 弹 出 “Linear Regression: Statistics” 对 话 框 ， 可 以 选 

中 “Regression Coefficients” 选 项 组 : 有 关 回 归 系 数 的 选项 ， 包 含 3 个 复 选 框 。 

a.“Estimates” 复 选 框 : SPSS 默认 输出 项 ， 输 出 与 回归 系数 相关 的 统计 量 ， 包括 回 
归 系 数 、 回 归 系 数 标准 误差 、 标 准 化 回归 系数 Beta、 回 归 系 数 显著 性 检验 的 1 统计 量 值 和 
双边 检验 的 显著 性 概率 尸 值 。 

b.“Confidence Intervals” 复 选 框 : 输出 每 个 非 标准 化 回归 系数 的 95 冯 的 置信 区 间 。 
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c. “Covariance matrix” 复 选 框 : 输出 非 标准 化 回归 系数 的 协 方差 矩阵 、 各 变量 的 相 
关系 数 矩 阵 。 

@ 模型 拟 合 效果 选项 组 : 包含 5 个 复 选 框 ， 下 面 只 介绍 其 中 常用 的 两 个 选项 。 

a.“Model fit” 复 选 框 ， SPSS 默认 输出 项 ， 输 出 相关 系数 、 判 定 系 数 、 修 正 的 判定 系 
数 、 回 归 方 程 的 标准 误差 、 回 归 方 程 显著 性 下 检验 、 方 差分 析 表 。 
). “Descriptives” 复 选 框 : 输出 每 个 变量 的 均值 、 标 准 差 、 相 关系 数 和 矩阵 及 单 侧 检 验 
显著 性 概率 卫 值 。 

图 “Residuals” 选 项 组 ， 有 关 残 差分 析 的 选项 ， 包 含 两 个 复 选 框 。 

选择 “Casewise diagnostics” 项 中 的 “All cases” 单 选 按钮 ， 输 出 预测 值 、 标 准 化 预 
测 值 、 残 差 、 标 准 化 残 差 等 。 

@ 单 击 “Continue” 按 钮 ， 返 回 “Linear Regression” 对 话 框 ， 

(5) 单 击 “Save” 按 钮 ， 弹 出 “Linear Regression: < 杰 江 稚 。 

四 “Predicted Values” 项 : 选择 输出 预测 值 。 YA 

a.“Unstandardized” 复 选 框 : 非 标准 化 预测 值 ti). 

b.“Standardized” 复 选 框 : 标准 化 预测 值 《天 

c. “S,. E. of mean Predictions” 复 选 框 : 项 测 信 均值 标准 识 关 ， 

加 “Residuals” 项 ， 选择 输出 残 差 什 

a. “Unstandardized” 复 选 框 : 非 将 淮 演化 残 关 人 

b. “Standardized” 复 选 框 : 棕 准 化 减 差 。 % 

@ “Prediction TIntervals7 项 选择 输出 预测 区 园 87 

a.“Mean” 复 选 框 ; 项 测 区 间 下 限 的 平均 信 。 

b. “Individual”3 选 框 ; 观测 量 预 测 值 -| 下 限 的 间距 。 

c. “ConfidenceThterval” 框 : 答 入 呈 人 水 平 。 系统 默认 的 置信 水 平 是 95%。 

@ 单 击 ontinve” 按钮 ， 返 回 “Linta ar Regression” 对 话 框 。 

(6) 单 击 “Options” 按 钮 ， 弹 出 “Linear Regression: Options” 对 话 框 。 

“Include constant in equation” 复 选 框 : 在 回归 方程 中 包含 常数 项 ， 是 系统 默认 的 
选项 。 

加 “Missing Values” 项 : 缺失 值 处 理 。 

a. “EExclude cases listwise” 单 选 按钮 : 将 变量 中 具有 缺失 值 的 观测 量 排除 在 计算 
之 外 。 

b.“Exclude cases pariwise” 单 选 按钮 : 剔除 计算 相关 系数 的 一 对 变量 中 含有 缺失 值 
的 观测 量 。 

c.“Replace with mean” 单 选 按钮 : 用 变量 的 平均 值 代 蔡 缺失 值 。 

图 单 击 “Continue” 按 钮 ,返回 “Linear Regression” 对 话 框 。 

(7) 单 击 “OK” 按 钮 ， 得 到 线性 回归 分 析 输 出 结果 
回 夫 藻 回 【 例 6.7】 用 spss 统计 分 析 软 件 的 线性 回归 分 析 功 能 ， 对 例 6.2 中 学 
3 生 的 统计 学 考试 成 绩 与 高 等 数学 考试 成 绩 进行 回归 分 析 。 
酝 


















































解 : 调用 SPSS 统计 分 析 软 件 的 线性 回归 分 析 功能 ， 得 到 以 下 输出 结果 ， 
【拓展 视频 】 ”如 表 6- 11 一 表 6- 17 所 示 。 
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表 6-11 基本 描述 统计 量 (Descriptive Statistics) 

Mean Std. Deviation N 

统计 学 80. 50 11.247 10 

高 等 数学 80. 10 10. 682 10 

由 表 6 -11 可 知 ， 参 与 分 析 的 两 个 变量 的 样本 数 都 是 10， 学 生 的 统计 学 考试 成 绩 的 平 





均值 是 80. 50 分 ， 标 准 差 是 11. 247 分 ; 高 等 数学 考试 成 绩 的 平均 值 是 80. 10 分 ， 标 准 差 


是 10. 682 分 。 


表 6-12 相关 系数 (Correlations) 




















统 计 学 高 等 数学 
统计 学 1.000 /, KS .964 
Pearson Correlation - SN 
高 等 数学 .Ad 1. 000 
统计 学 p a .000 
Sig. (1— tailed) 
高 等 数学 一 ooo 
统计 学 ,| 10 10 
N 
高 等 数 溉 0K 10 10 














由 表 6 一 12 可 知 ， 


pf 


Model 


\ 
、 


¢ < 
统计 学 落 试 碟 续 与 高 等 数学 考试 成 绩 的 相关 系数 是 一 0.964， 单 边 
检验 的 显著 性 概率 P 一 0. 0007 者 于 P 二 0.01， 说 明 统计 学 考试 成 绩 与 高 竺 数学 考试 成 绩 
之 间 旺 正 线性 相关 关系 广 入 相关 性 特别 显著 ， SE 


Variables Entered 


Variables Removed 


AN 
和 全 表 6-13 回归 方式 奈 [Viriables Entered/Removed) 


Method 








1 





高 等 数学 * 





Enter 





a. All requested variables entered; b, Dependent Variable: 统计 学 





由 表 6 一 13 可 知 ， 


法 。 该 表 主 要 针对 多 元 








加 











加 


表 6-14 模型 拟 合 程度 (Model Summary (b)) 


归 分 析 采 用 的 是 强行 进入 法 ， 即 全 部 自 变 量 均 进 入 回归 方程 的 方 
归 分 析 ， 相 对 一 元 回归 分 析 可 以 省 略 。 








Model R R sq Adjusted R Sq 人 
lel uare uare 
the Estimate 
1 .964 (a) .930 .921 3.165 

















a，Predictors: (Constant)， 高 等 数学 ;，b，Dependent Variable: 统计 学 





由 表 6- 14 可知， 统计 学 考试 成 绩 与 高 等 数学 考试 成 绩 的 相关 系数 是 "一 0. 964， 判 决 


系数 是 及 一 0.930， 修 了 


拟 合 效果 很 理想 。 





E 的 判定 系数 R? 二 0. 921， 估 计 标 准 误 关 6 一 3. 165。 可 见 ， 模 型 的 
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表 6-15 方差 分 析 表 (ANOVA (b)) 














Model Sum of Squares df Mean Square 了 Sig. 
. Regression 1058. 355 1 1058. 355 105. 618 .000 (a) 
Residual 80. 145 8 10. 018 
Total 1138. 500 9 




















a。Predictors:(Constant), 高 等 数学 ; b，Dependent Variable: 统计 学 











革 








由 表 6 一 15 可 知 ， 回 归 平 方 和 为 1058. 355， 自 由 度 为 1， 均 方差 为 1058. 355; 剩余 了 
方 和 为 80. 145， 自 由 度 为 8， 均 方差 为 10. 018; 总 平方 和 为 1138. 500， 自 由 度 为 9; 下 统 
计量 的 值 为 105. 618， 单 边 检 验 概率 值 为 P=0. 000 一 一 0.01， 除 


表 6-16 回归 方程 系数 表 (Coefficients (a)) 入 
Re @ Unstandardized ee @ 




















六 t Sig. © 
CoefficientsG) Ga cients@® 
< 
B Std. Error, “A Beta 
| (Constant) | 一 .817 7.976 天 小 一 :102 .921 
~ A 
高 等 数学 1.015 | 、\OM™ .964 10. 277 .000 























a Dependent Variable 统计 学 ，， SK \ < 


由 表 6 一 16 可 知 ， Shione nh 标准 误差 为 7.976; 回归 系 
数 为 1，015， 标 准 误差 为 0.099; 由 此 得 出 植 计 二 元 线性 回归 方程 为 立 一 一 0.817 十 


1.015X。( 见 表 中 第 多 列 ) 。 下- 

ed ott (Beta) 为 0.964， 回 归 方 程 标准 化 后 就 没有 常数 项 了 。 
( 见 表 中 第 @ 列 )。 

常数 项 检验 的 上 统计 量 的 值 为 一 0. 102， 显 著 性 概率 P=0. 921 之 a 二 0.05， 说明 常 数 项 
不 显著 ， 可 以 考虑 去 除 常 数 项 的 回归 方程 ;回归 系数 检验 的 上 统计 量 的 值 为 10.277， 显著 
性 概率 P==0.000 二 a 二 0.01, 说 明 回 归 系 数 是 特别 显著 的 ， 也 就 是 说 ， 高 等 数学 考试 成 绩 
对 统计 学 考试 成 绩 的 影响 特别 显著 。( 见 表 中 第 @、@ 列 ) 。 














表 6-17 残 差 统计 结果 (Residuals Statistics (a)) 
Std. 
Minimum Maximum Mean N 
Deviation 
Predicted Value 60. 09 96. 64 80. 50 10. 844 10 
Std. Predicted Value —1. 882 1.489 .000 1.000 10 
Residual 一 5. 490 4. 662 .000 2. 984 10 
Std. Residual 一 1.734 1. 473 .000 .943 10 




















a. Dependent Variable: 统计 学 
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在 表 6-17 中 ,从 第 2 列 到 第 5 列 依 次 表示 最 小 值 、 最 大 值 、 平 均值 、 标 准 差 和 样本 
容量 ;从 第 2 行 到 第 5 行 依次 表示 预测 值 、 标 准 化 预测 值 、 残 差 和 标准 化 残 差 。 
【 例 6.8】 在 导入 案例 6- 2 中 ， 探 讨 了 我 国 商业 银行 产生 不 良 贷款 的 现状 。 下 面 以 具 





体 实例 研究 多 元 回归 分 析 在 银行 中 的 应 用 。 





一 家 大 型 商业 银行 在 多 个 地 区 设 有 分 行 ， 其 业务 主要 是 进行 基础 设施 建设 、 国 家 重点 











项 目 建设 、 固 定 资产 投资 等 项 目的 贷款 。 近 年 来 ， 该 银行 的 贷款 额 平稳 增长 ， 但 不 良 贷款 
额 也 有 较 大 比例 的 提高 ， 这 给 银行 业务 的 发 展 带 来 较 大 压力 。 为 了 弄 清楚 不 良 贷款 形成 的 








































































































原因 ,希望 利用 银行 业务 的 有 关 数 据 做 一 些 定量 分 析 ， 以 便 找 出 控制 不 良 贷款 的 办 法 。 
2015 年 该 银行 所 属 的 25 家 分 行 的 有 关 业 务 数据 如 表 6- 18 所 示 。 
表 6-18 某 商 业 银行 2015 年 的 主要 业务 数据 表 
本 年 固定 
分 行 编号 资产 投资 额 X 
/ 亿 元 
1 54.7 
2 93.8 
3 76.6 
4 18.5 
5 66.3 
6 4.9 
7 了 23.6 
8 12. YA 188.9 隐 疙 志 18 46.9 
9 一 99.6 SS 全 11 56.1 
10 2A 久 9 761 、 痊 0.1 16 67.6 
11 NR 67.8 让 | 12 45.9 
12 4.3 135.6 政 洒 25 79.8 
13 ia 67.7 6.9 16 25.9 
14 3.8 177.9 13.6 27 120.1 
15 10.5 266.6 16.5 35 149.9 
16 ER 82.6 9.8 16 32.7 
17 0.5 17.9 1.5 1 45.6 
18 0.7 76.7 6.8 13 28.6 
19 3 7 5.9 6 16.8 
20 143. 1 8. 1 29 67.8 
21 11.9 371.6 17.7 34 167.2 
22 1.9 99.2 4.7 12 47.8 
23 1.5 112.9 于 16 70.2 
24 7.5 199.8 16.7 i 43.1 
25 3.6 105.7 12.9 12 100.2 
(1) 分 别 绘 制 不 良 贷款 与 贷款 余额 、 应 收 贷款 、 贷 款项 目 数 、 固 定 资产 投资 额 之 间 的 
散 点 图 ， 并 分 析 其 关系 。 若 有 关系 ， 它 们 之 间 是 一 种 什么 样 的 关系 ? 关系 强度 如 何 ? 
(2) 建立 不 良 贷款 与 贷款 余额 、 累 计 应 收 贷款 、 贷 款项 目 数 、 固 定 资产 投资 额 等 因素 
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的 多 元 线性 回归 方程 ， 解 释 各 回归 系数 的 实际 意义 并 对 回归 方程 线性 关系 的 显著 性 及 各 回 
归 系 数 的 显著 性 进行 检验 (a 二 0. 05) 。 

(3) 在 不 良 贷款 的 总 变 差 中 ， 被 估计 的 回归 方程 所 解释 的 比例 是 多 少 ? 

(4) 若 贷款 余额 zi 二 100 〈 亿 元 ) 、 累 计 应 收 贷款 zz 二 10 〈 亿 元 )、 贷 款项 目 数 zs 一 15 


























(个 ) 和 固定 资产 投资 额 x 二 60 〈 亿 元 )， 根 据 建 立 的 回归 方程 ， 求 不 良 贷款 (>) 的 点 估计 。 
解 : (1) 不 良 贷款 与 各 项 贷款 余额 间 的 散 点 图 如 图 6. 8 所 示 。 





12.5 
o 
o 
100F 7 
3 /XX R 
¥ 。 NN 
型 \ 
攻 








0 000\ 200.0 0 4000 
AR > 
Sh, S 各 项 贷款 公 昌 
图 68》 不 良 贷款 与 各 项 贷款 余额 间 的 散 点 图 
不 良 贷款 与 各 项 贷款 余额 间 的 相关 系数 及 显著 性 检验 如 表 6 -19 所 示 。 
2 人 
1 “> 表 6- 19 不 良 贷款 和 有 项 贷款 余额 间 的 相关 系数 














# 不 良 贷 款 各 项 贷款 余额 
Pearson Correlation 1 .846** 
不 良 贷款 Sig. (2 -tailed) | .000 
N | 25 25 











#*# 。 Corre) 


lation is significant at the 0. 01 level (2— tailed) 











由 不 良 贷 款 与 各 项 贷款 余额 间 的 散 点 图 和 相关 系数 可 以 得 出 ， 不 良 贷款 与 各 项 贷款 余 
额 间 存 在 着 较 显著 的 线性 关系 。 
不 良 贷款 与 其 他 款项 间 的 散 点 图 绘制 和 相关 关系 的 分 析 类 似 。 
(2) 调用 SPSS 统计 分 析 软 件 的 线性 回归 分 析 功 能 ， 结 合 题 中 的 实际 需求 ， 可 以 有 选 
择 地 输出 以 下 结果 。 
表 6-20 模型 拟 合 程度 (Model Summary (b)) 
Model R R Square Adjusted R Square Std. Error of the Estimate 
1 .893* | .798 | .758 | 1.7744 








a。 Predictors: (Constant)， 本 年 固定 资产 投资 额 ， 本 年 累计 应 收 贷款 ， 贷 款项 目 数 ， 各 项 贷款 余额 


第 6 章 























相关 及 回归 分 析 | 219 
表 6-21 方差 分 析 表 (ANOVA (b)) 
Model Sum of Squares df Mean Square F Sig, 
Regression 248. 878 4 62.219 19. 761 .000s 
1 Residual 62. 972 20 3. 149 
Total 311. 850 24 























a，Predictors: (Constant)， 本 年 固定 资产 投资 额 , 本 年 累计 应 收 贷款 ,贷款 项 目 数 , 各 项 贷款 余额 ， 
b，Dependent Variable: 不 良 贷款 





表 6-22 回归 方程 系数 表 (Coefficients (a)) 





















































Unstandardized 
Model Coefficients Sig. 
B Std. Error | 

(Constant) 一 . 946 .860/r 未 二 一 1.100 | .284 
各 项 贷款 余额 .040 Ye .893 3. 842 .001 
1 | 本 年 累计 应 收 贷款 “151 en .264 1.919 .069 
贷款 项 目 数 .007 N KN 085 .017 .087 .932 
本 年 固定 资产 投资 额 一 xX% NA .015 A 一 1.822 | .083 

a。Dependent Variable: 不 良 贷款 广 

一 
由 表 6-20 一 - 表 6- 下 可 多 、 什 计 四 元 : 回 次 计 各 为 


二 0. 946 十 0. 040X1 十 qz 2z 叶 0. 007X3 一 0. 028X4 

修正 的 判 A 758， 说 明 模型 的 谷 程度 较 高 。 在 对 回归 方程 的 显著 性 检 
pi 显著 性 概率 卫 二 0.000 过 4 三 0.05， 说明 四 元 线性 回归 方程 高 度 5 
对 回归 系数 的 显著 性 检验 中 ,各 项 贷款 余额 系数 : 检验 的 统计 量 的 显著 性 概率 己 一 0. 005 一 
a 二 0.05， 说 明 各 项 贷款 余额 对 不 良 贷 款 的 影响 特别 显著 ; 但 本 年 累计 应 收 贷款 、 贷 款项 
目 数 和 本 年 固定 资产 投资 额 对 不 良 贷 款 的 影响 不 显著 。 

由 计算 所 得 的 判决 系数 及 检验 结果 可 以 看 出 ， 不 良 贷 款 与 各 项 贷款 余额 、 本 年 累计 应 
收 贷款 、 贷 款项 目 数 及 本 年 固定 资产 投资 额 总 体 呈 显著 的 线性 相关 关系 ， 但 在 建立 的 多 元 
线性 回归 方程 中 仅 不 良 贷款 与 各 项 贷款 余额 间 存 在 着 较 显著 的 线性 关系 ,不良 贷 款 与 其 他 
款项 间 的 线性 关系 不 显著 。 

可 归 系 数 表 示 当 控制 其 他 自 变量 不 变 的 条 件 下 ， 其 对 应 的 自 变量 的 单位 变动 对 因 变 量 
平均 值 的 影响 。 就 回归 方程 中 各 项 贷款 余额 的 系数 而 言 ， 它 表示 各 项 贷款 余额 每 增加 1 亿 
元 ， 不良 贷款 平均 增加 0. 040 亿 元 。 

(3) 在 不 良 贷款 的 总 变 差 中 ,被 估计 的 回归 方程 所 解释 的 比例 为 R? 二 0.798， 即 被 估 
计 的 回归 方程 所 解释 的 比例 为 79. 8% 。 

(4) 若 贷款 余额 ri 二 100( 亿 元 )、 累 计 应 收 贷款 zz 二 10( 亿 元 )、 贷 款项 目 数 zs 一 15 
(个 ) 和 固定 资产 投资 额 x 二 60( 亿 元 )， 则 根据 回归 方程 ， 不 良 贷款 的 预测 值 为 

yw 一 一 0.946 十 0. 040X100 十 0. 151X10 十 0. 007X15 一 0.028X60 一 2. 989( 亿 元 ) 
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6. 5.3 曲线 回归 分 析 SPSS 软件 操作 步骤 
曲线 回归 分 析 SPSS 软件 的 操作 步骤 如 下 : 











(1) 选择 “Analyze-Regression-Curve Estimation” 选 项 ， 弹 出 “Curve Estima- 


tion” 对 话 框 。 











(2) 将 因 变 量 放 入 “Dependent(s)” 框 ,可 以 一 次 选 入 多 个 因 变 量 ， 此 时 对 选 入 的 各 




















个 因 变 量 分 别 进行 拟 合 。 
将 自 变 量 放 入 “Independent” 框 ， 包 含 两 个 单 选 按钮 。 
@“Variable” 单 选 按钮 : 选 入 左 侧 列表 框 提供 的 自 变 量 。 
@“Time” 单 选 按钮 : 选 入 时 间作 为 自 变量 。 


的 点 标记 。 站 
(4)“Include constant in equation” 复 选 框 : 选择 回归 构 开 中 含 常数 项 。 
(5)“Plot models” 复 选 框 : 选择 绘制 曲线 拟 合 

(6)“Models” 复 选 框 : 选择 一 个 或 多 个 拟 合 | 线 简 坟 型 。 共 有 11 种 曲线 。 
“Linear” 复 选 框 : 一 元 线性 方程 Y 一 AR 

“Logarithmic” 复 选 框 : 对 数 曲线 方 雹 二 4 十 blnX。 

“Inverse” 复 选 框 ， 倒 数 曲线 亦 程 了 二 2 二 O/X。 

“Quadratic” 复 选 框 : 六 程 Y=bo 1 

“Cubie” 复 选 框 ， 光线 诅 Yb-+hh Xi 人 Xs, 
“Power” 复 选 框 : 需 籽 线 方 程 Y= aX’。 只 

“Compound” 4 框 # 复合 曲线 方程 了 a 

“Ss” 复 先 要 CS 型 曲线 方程 Y 二 3 了 

“Logis ” 敌 选 杠 : Logistic 出 线 方 逢 Y P=1/[1/ut (ab*)]。 


@@IQA@GOO806 


(3) “Case Labels” 列 表 框 : 7 作为 散 点 


图 中 


选择 该 项 需要 在 “Upper bound” 框 内 输入 上 限 值 ,4 应 为 正 数 且 大 于 最 大 的 因 变 量 的 值 。 


四 “Growth” 复 选 框 : 生长 曲线 方程 了 Y 一 ee 全 。 

四 “Exponential” 复 选 框 :指数 曲线 方程 Y=ae 信 

(7)“Display ANOVA Table” 复 选 框 : 结果 中 输出 方差 分 析 表 。 

(8) 单 击 “Save” 按 钮 ， 弹 出 “Curve Estimation: Save” 对 话 框 。 
@“Save Variables” 项 : 保存 变量 。 

a. “Predicted values” 复 选 框 : 保存 预测 值 。 

b.“Residuals” 复 选 框 : 保存 残 差 值 。 

c.“Predicted intervals” 复 选 框 : 保存 预测 区 间 。 

d. “Confidence interval” 项 : 选择 置信 水 平 。 系 统 默 认 的 置信 水 平 是 95%。 























回 “Predict Cases” 项 : 预测 观测 量 。 自 变量 为 时 间 变 量 时 使 用 ,如 计算 时 使 
观测 量 ， 则 可 忽略 此 项 。 

@ 单 击 “Continue” 按 钮 ， 返 回 “Curve Estimation ”对话 框 。 

(9) 单 击 “OK” 按 钮 ， 得 到 曲线 回归 分 析 输 出 结果 。 











全 部 





【 例 6.9】 表 6-23 是 2016 年 某 种 旧 设 备 价格 的 调查 资料 ， 试 建立 该 种 设备 的 了 


格 关于 使 用 年 数 的 回归 方程 。 
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表 6-23 2016 年 某 种 旧 设备 价格 的 调查 资料 
使 用 年 数 X 1 kj 4 5 6 7 8 9 10 
平均 价格 Y/ 百 元 2651 | 1943 | 1494 | 1087 | 765 538 | 484 290 | 226 204 
解 : 调用 SPSS 统计 分 析 软 件 中 的 绘图 功能 ， 绘 制 散 点 图 如 图 6.9 所 示 。 
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图 6.9 平均 价格 与 使 用 年 数 的 散 点 图 
由 图 6.9 可知， 平均 价格 与 使 用 年 限 呈 指数 曲线 鸥 势 从 调用 SPSS 统计 分 析 软件 的 曲 


线 估 计 功 能 ， 得 到 曲线 拟 合 图 如 图 6. 10 所 示 。 
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图 6.10 平均 价格 与 使 用 年 数 的 曲线 拟 合 图 
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图 6. 10 显示 ， 有 几 条 曲线 的 拟 合 效果 都 比较 好 ， 下 面 根据 统计 检验 来 选择 最 优 曲线 。 





























表 6-24 是 各 种 曲线 拟 合 统计 检验 整理 后 的 结果 。 
表 6-24 几 种 曲线 分 析 结 果 的 比较 

曲线 类 型 判决 系数 估计 标准 误差 下 值 显著 性 概率 PP 
Linear 0. 87634 307. 78046 56. 69267 0. 0001 
Logarithmic 0. 99225 77.05614 1024. 10220 0. 000 
Inverse 0. 89680 281. 16238 69. 52160 0,. 000 
Quadratic 0. 994077 72. 04154 586. 89299 0. 000 
Cubic 0. 99845 39. 74187 1291. 35947 0. 000 
Power 0. 90981 0. 28818 80. 703 2 0.000 
S 0. 66171 0.55812 els 0.0042 

SS 

Exponential 0.99243 0.08351 < 10848.19411 0. 000 

















六 


综合 各 项 结果 来 看 ， 实 际 观测 点 we et Y==aex 的 模拟 效果 最 好 ， 
其 判决 系数 达到 0. 99243， 标 准 误差 只 PY ~ 下 值 达到 1048. 19， 回归 方程 高 度 显 
著 。 因 此 平均 价格 与 使 用 年数 之 问 的 相关 奖 率 闻 择 指数 出 线 方程 二 3514, 2626c- m0 
来 描述 。 

表 6- MO 索 

平均 价格 与 使 用 年 数 的 措 数 出 线 拟 合 图 如 图 6， 所 大 


Sr 25 2 细 输 出 结果 
MODEL: MC DA 入; 








Dependent vagiauie. < NM 和 er JNENT 
Listwise NS Missing Data 

Multiple R .99621 

R Square .99243 

Adjusted R Square .99148 

Standard Error .08351 





Analysis of Variance: 





DF SumofSquares Mean Square 


Regression 1 7. 3106262 7. 3106262 
Residuals 8 .0557960 .0069745 
F=1048. 19411 Signif F= .0000 





Variables in the Equation 
Variable B SEB Beta 填 Sig 工 
汽 一 .297680 .009195 一 .996206 一 32.376 :0000 
(Constant) 3514. 262600 200. 490608 17. 528 :0000 
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A 实例 分 析 上 x 5 ba - 
基于 需 来 的 天 津 市 高 术 规模 的 回归 分 析 


自 1999 年 她,y 类 洋 市 高 等 教育 进行 了 几 规 模 扩 张 。 在 天 津 市 宏观 发 展 框架 下 ， 高 和 


教育 得 以 快速 增长 ， 规 模 迅 速 扩 大 。 从 天 津 市 乃至 全 国 高 等 教育 整体 发 展 趋势 来 看 ， 未 来 
几 年 ， 高 等 教育 的 规模 还 将 继续 保持 一 个 较 高 的 增长 水 平 。 因 此 ,确定 适度 的 高 校 学 生 规 
模 是 高 等 教育 可 持续 发 展 的 关键 。 

高 等 教育 的 需求 简单 地 说 就 是 社会 和 个 人 对 高 等 教育 有 支付 能 力 的 需要 。 影 响 高 等 教 
育 发 展 规模 的 需求 因素 有 很 多 ， 如 现 有 人 口中 接受 过 高 等 教育 的 比例 、 社 会 经 济 发 展 水 
平 、 居 民 对 于 高 等 教育 的 需求 等 ， 其 中 有 些 因素 是 难以 确定 的 。 从 居民 对 于 高 等 教育 的 需 
求 角度 来 探讨 高 等 教育 发 展 的 规模 ， 如 我 们 选择 天 津 市 普通 高 等 学 校 在 校生 人 数 作 为 发 展 
规模 变量 ,选择 天 津 市 城镇 居民 的 人 均 可 支配 收入 和 户籍 人 口 数 作为 发 展 规模 的 主要 影响 
变量 。 有 关 部 门 想 要 解决 以 下 问题 : 

(1) 分 析 城 镇 居民 的 人 均 可 支配 收入 和 户籍 人 口 数 与 高 校 在 校生 数 的 关系 。 

(2) 探求 城镇 居民 的 人 均 可 支配 收入 和 户籍 人 口 数 对 高 校 在 校生 数 的 影响 程度 。 

(3) 基于 需求 的 角度 对 天 津 市 高 校 发 展 规模 进行 统计 分 析 。 

一 、 学 习 目 标 

通过 本 案例 的 学 习 ， 要 求学 生 熟 练 掌握 回归 分 析 的 基本 方法 及 其 应 用 。 考 核 学 生 对 回 
归 分 析 的 理解 程度 。 
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二 、 案 例 分 析 

这 是 一 个 典型 的 研究 变量 之 间 相 关 关系 的 实际 问题 。 为 了 实现 研究 目标 ， 就 要 分 析 城 
镇 居民 的 人 均 可 支配 收入 和 户籍 人 口 数 这 两 项 指标 与 高 等 学 校 在 校生 人 数 之 间 的 相关 关 
系 ， 这 就 需要 大 量 的 样本 数据 ， 我 们 从 《2015 天 津 统计 年 鉴 》 搜 集 到 1999 一 2014 年 共 16 
年 的 有 关 指 标的 数据 资料 。 为 解决 本 案例 问题 ， 还 需要 建立 描述 高 等 学 校 在 校生 人 数 与 城 
镇 居民 的 人 均 可 支配 收入 和 户籍 人 口 数 之 间 的 相互 关系 的 回归 模型 ， 再 根据 所 得 到 的 样本 
数据 求解 出 反映 高 等 学 校 在 校生 人 数 与 城镇 居民 的 人 均 可 支配 收入 和 户籍 人 口 数 之 间 的 相 
互 关系 的 回归 方程 ， 最 后 根据 回归 方程 进行 分 析 。 

1. 收集 样本 数据 


表 6-26 1999 一 2014 年 天 津 市 高 等 教育 发 展 规模 需求 变量 数据 资料 





















































年 份 在 校生 数 Y/ 万 人 SI 人 a 加 
1999 9.05 _ és 910.17 
2000 11.77 VS A 912. 00 
2001 15. 40 -| 2 NN 8959 913. 98 
2002 19. 69 SN 9338 919. 05 
2003 24.5 AN "4 926. 00 
2004 区 到 、 3 932. 55 
2005 和 X ”A hs 939. 31 
2006 7 \ ) 35.74 ,外 nS ”14283 948. 89 
2007 XO 37.11 > 隐 ” 16357 959. 10 
2008 1/ 38. 64 19423 968. 87 
2009 40. 60 21402 979. 84 
2010 42. 92 24293 984. 85 
2011 44. 97 26921 996. 44 
2012 47. 31 29626 993. 20 
2013 48. 99 28980 1003. 97 
2014 50.58 31506 1016. 66 














资料 来 源 : 《2015 天 津 统计 年 鉴 》 
2. 建立 需求 回归 模型 
需求 模型 采用 多 元 统计 分 析 中 的 二 元 回归 分 析 模 型 ， 并 假设 初始 回归 模型 为 二 元 线性 
回归 模型 : 
Y=pB+PB Xi+P: Xt+e 


式 中 ,po 、Pl 、 民 为 待定 系数 ; e 为 随机 误差 项 。 
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相关 及 





日 








3. 用 软件 求解 并 进行 回归 分 析 
在 采用 强行 进入 法 进行 多 元 线性 回归 分 析 时 ， 得 到 以 下 主要 和 输出 结果 ， 如 表 6-27 一 
表 6-29 所 示 。 


表 6-27 判决 系数 及 标准 误差 表 (b) 


Model 1 R Square Adjusted R Square Std. Error of the Estimate 














1 0. 967" | .936 .926 3.675 
a Predictors: (Constant)， 户 籍 人 口 数 ， 可 支配 收入 
b，Dependent Variable: 在 校生 数 











表 6-28 回归 方程 的 拟 合 优 度 检验 表 (b) 






































Model Sum of Squares df Mean RS F Sig. 
Regression 2552. 323 2 76K131 94. 471 .000， 
1 Residual 175. 611 13 小 M13.509 
4= 
Total 2727. 934 te | 
a Predictors: (Constant)， 户 籍 人 口 数 ， LR 
b，Dependent Variable: 在 校生 数 SS 





表 6-22 的 (a) 

















-一 
和 十 < Standardized 
Model > 入 Coeffic Coefficients 上 Sig. 
Ce 
NX> 六 B 说 Error Beta 
(Constant 一 565. 497 148. 348 一 3.812 | 0.002 
1 可 支配 收入 一 0.001 0. 001 一 85 一 1.747 | 0.104 
户籍 人 口 数 0. 649 0. 168 1.735 3. 860 0. 002 























a。Dependent Variable: 在 校生 数 





表 6-27 一 表 6-29 表明 ,调整 后 的 判决 系数 为 0.926， 说 明 模 型 的 拟 合 程度 很 高 ; 在 对 
回归 方程 的 显著 性 检验 中 ,下 检验 的 统计 量 的 值 为 94.471， 显 著 性 概率 值 已 一 0.000 一 一 
0.01， 说 明 二 元 线性 回归 方程 高 度 显著 ;在 对 回归 系数 的 显著 性 检验 中 ， 人 均 可 支配 收入 
和 户籍 人 口 数 回 归 系 数 的 上 检验 的 统计 量 的 值 分 别 为 一 1.747 和 3.860， 显 著 性 概率 值 分 
别 为 0.104 和 0.002， 在 显著 性 水 平 一 0.05 下 ,说 明 户 籍 人 口 数 对 在 校生 数 的 影响 总 体 
上 是 显著 的 ， 而 人 均 可 支配 收入 对 在 校生 数 的 影响 并 不 显著 。 

以 上 分 析 结 果 表 明 ， 采 用 二 元 线性 回归 分 析 模 型 来 描述 天 津 市 普通 高 等 学 校 在 校生 数 
与 城镇 居民 人 均 可 支配 收入 、 户 籍 人 口 数 之 间 的 关系 是 合适 的 。 因 此 ,构建 高 等 教育 规模 
的 需求 模型 为 

Y 一 一 565. 497 一 0. 001Xi 十 0. 649X2 +e 
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4. 基于 需求 角度 的 高 校 教育 规模 的 统计 分 析 

依据 天 津 市 高 等 教育 规模 的 需求 模型 ， 可 以 对 扩招 后 天 津 市 的 高 等 教育 规模 进行 统计 
分 析 。 根 据 需 求 模型 的 回归 方程 yY 一 一 565. 497 一 0. 001X1 十 0. 649Xs 十 s， 我 们 对 1999 年 
至 2014 年 天 津 市 高 等 教育 发 展 规模 进行 了 预测 计算 ， 预 测 结果 如 表 6 一 30 所 示 。 


表 6-30 1999 一 2014 年 天 津 市 高 等 教育 实际 需求 量 与 预测 量 对 照 表 (单位 : 万 人 ) 



























































普通 高 校 学 生 普通 高 校 学 生 
年 份 实际 量 -预测 量 
需求 量 实际 值 需求 量 预测 值 
1999 9.05 15. 39 一 6.34 
2000 11.77 15. 97 一 4. 20 
2001 15. 40 16. 23 一 0.83 
- 检 
2002 19. 69 19.04 ,Xx 0.65 
) 最 
2003 24. 52 22.3A | 2.19 
2004 28. 61 /ZR 3.47 
2005 33. 16 人 二 06 5. 10 
2006 35.74 小 RS 32. 22 3.52 
2007 37.11 二 36. 25 0. 86 
2008 38. 64 Wy 38. MWA 一 0.11 
ww FN 
2009 40 0 9 7 =299 
Vy 
2010 N292 .03 = 
2011 和 /44.97 EV 47.26 一 2. 29 
一 一 和 
2012 Ng 47. 31 从 41.78 5.53 
2013 /4 48. 99 49. 57 一 0.58 
2014 50. 58 54. 64 一 4.06 











由 表 6 一 30 可 以 看 出 ， 在 1999 年 至 2001 年 ， 天津 市 高 等 教育 发 展 的 实际 规模 低 于 需 
求 预测 规模 平均 约 4 万 人 ; 在 2002 年 至 2007 年 ,天津 市 高 等 教育 发 展 的 实际 规模 高 于 需 
求 预测 规模 平均 约 2.6 万 人 ; 而 在 2008 年 至 2014 年 ， 天 津 市 高 等 教育 发 展 的 实际 规模 又 
低 于 需求 预测 规模 平均 约 0. 63 万 人 。 由 此 揭示 出 天 津 市 高 等 教育 发 展 的 实际 规模 与 基于 
收入 和 人 口 需求 的 预测 规模 之 间 的 差距 。 

从 以 上 相关 和 回归 分 析 结 果 可 以 看 出 : 

第 一 ， 天 津 市 高 等 教育 发 展 规模 与 城镇 人 均 可 支配 收入 、 户 籍 人 口 数 之 间 总 体 上 存在 
高 度 密切 的 正 相 关 关 系 , 尤其 人 口 数 的 不 断 增加 对 高 等 教育 发 展 规模 的 扩大 具有 很 强 的 促 
进 作用 。 

第 二 ， 对 天 津 市 高 等 教育 发 展 规模 有 显著 地 促进 作用 的 户籍 人 口 数 与 在 校生 人 数 的 
回归 系数 为 0.649， 这 意味 着 户籍 人 口 数 每 增加 1 万 人 ,高 校 在 校生 人 数 平均 增加 
0.649 万 人 。 
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第 三 ， 从 需求 角度 而 言 ，1999 一 2014 年 期 间 天 津 市 高 等 教育 发 展 的 实际 规模 是 逐步 
增加 的 趋势 ， 但 是 从 城镇 居民 收入 与 人 口 方 面 的 需求 角度 来 说 ， 其 预测 发 展 
规模 是 呈 起 伏 中 上 升 的 趋势 ， 而 实际 规模 与 预测 规模 相 比 总 体 上 有 些 差距 。 
虽然 我 们 只 是 从 城镇 居民 生活 水 平和 人 口 增长 的 角度 来 研究 高 等 教育 发 展 规 
模 的 需求 量 ， 所 选 变量 可 能 具有 一 定 的 局 限 性 ， 但 是 研究 所 得 的 结论 仍然 具 
有 一 定 的 现实 意义 。 





【拓展 案例 】 





经 济 现象 的 发 展 变化 受 很 多 因素 的 影响 ， 但 是 这 种 影响 关系 在 很 多 情况 下 并 非 确 | 
定 的 函数 关系 ， 而 是 一 种 相关 关系 。 要 了 解 现象 发 展 变 化 的 影 阅 色素 和 影响 结果 ， 就 
必须 对 这 种 相关 关系 进行 分 析 ， 并 给 出 现象 之 间 相关 关系 站 问 归 分 析 模 型 ， 对 回归 参 
数 进行 估计 ， 并 对 回归 方程 进行 检验 ， 利 用 回归 方 ww 








Correlation Analysis 相关 分 析 
Correlation Strength > gt efficient 相关 系数 
Direction (Positive Versus Ce 相关 方 向 0 下 入 类 和 负 相 关 ) 

Scatter Plots A 、”。 散 点 图 3 4 六 

Pearson's Correlatiofr Coefficient 皮 尔 科 采 关系 数 

Independind aaple 自 变 量 P Dependent Variable 因 变 量 
Regression ‘Analysis 回归 分 析 Regression Model 回归 模型 
Regression Equation 回归 方程 Regression Coefficient 回归 系数 
Error Term 误差 项 Regression Line 回归 直线 
Method of Least Squares 最 小 二 乘法 Error Sum of Squares 误差 平方 和 
Regression Sum of Squares ”回归 平方 和 Mean Square Regression 回归 均 方 
Mean Square Error 误差 均 方 Coefficient of Determination 判定 系数 
Standard Error of Estimate ”估计 标准 误差 Residual 残 差 


Multiple Regression Analysis 多 元 回归 分 析 


< 





Multiple Regression Model 多 元 回归 模型 
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习 题 6 
一 、 选 择 题 
当 相 关系 数 r= 二 0 时 ，( 5 
现象 之 间 完 全 无 关 B. 相关 程度 较 小 
现象 之 间 完 全 相关 D. 现象 之 间 无 线性 相关 关系 


a 


中 9 


10. 


相关 分 析 与 回归 分 析 ， 在 是 否 需要 确定 自 变量 和 因 变 量 的 问题 上 ，( $e 
前 者 不 需要 确定 ,后 者 需要 确定 。 “B. 前 者 需要 确定 ,后 者 不 需要 确定 








两 者 均 需 确定 D. 两 者 都 不 需要 确定 

两 个 变量 的 相关 系数 为 0.8， 则 其 回归 直线 方程 的 判决 系 yi 

0.5 B. 0.8 C. 0.64 le 9 
回归 分 析 中 ， 各 实际 值 与 回归 值 的 离 差 平方 和 称 为 Cy 

总 平方 和 B. 判定 系数 C. 回归 RN D. 残 差 平方 和 
Wn 

判决 系数 B. 回归 系数 D. 估计 标准 误差 


在 下 列 变量 之 间 的 关系 中 ，( 不 是 相关 关系 。 
在 销售 价格 不 变 的 情况 下 ， 关节 的 销售 人 与 销售 量 之 问 的 关系 


儿子 的 身高 与 他 父亲 的 身高 之 间 的 关系 xx、 
家 庭 的 支出 与 其 收入 之 间 的 关系 yy WX 
一 个 人 的 血压 和 年 龄 之 间 的 关系 wT 


某 产 品 的 单 们 成语 工 人 劳动 生产 率 之 问 前 回归 衣 线 方程 为 330 一 0. 67， 则 ( 
0.6 为 回归 系数 * 必 - 


0 二 RU 在 纵 负 的 本 户 
劳动 生 仓 率 每 增加 一 单位 ， 单 位 成 本 平均 上 升 0.6 元 


劳动 生产 率 每 增加 一 单位 ， 单 位 成 本 平均 下 降 0.6 元 

一 0.6 为 回归 系数 

在 一 元 线性 回归 分 析 中 ( je 

可 归 方 程 是 根据 最 小 二 乘法 确定 的 

判决 系数 测度 了 回归 方程 的 拟 合 程度 

估计 标准 误差 测度 了 观测 值 与 估计 值 之 间 的 平均 变异 程度 
用 下 统计 量 检验 线性 关系 

















用 1 统计 量 检验 回归 系数 的 显著 性 

工业 企业 的 产品 成 本 X 和 利润 Y 之 间 的 关系 可 能 用 ( ) 回 归 方 程 来 描述 。 
P=20+ 33 a 

?=20+ 六 B. Y=95—8.7X 

Y=8r+15X? D. Y=—15+7. 8X 

Y=14+5X 





工资 (元 ) 对 劳动 生产 率 〈 千 元 ) 的 回归 方程 为 > 王 10 十 70z， 这 意味 着 ( 





四 只 中 只 > 


劳动 4 





二 、 简 答题 


1. 区 别 下 列 概念 。 
(1) 相关 关系 与 函数 关系 ; (2) 了 








(3) 相关 分 析 与 回归 分 析 ; (4) 自 





变量 


劳动 生产 率 等 于 1000 元 ,工资 提高 70 元 
劳动 生产 率 每 增加 1000 元 ， 工 资 增长 70 元 
E 产 率 不 变 ， 工资 为 80 元 
. 劳动 生产 率 增加 1000 元 ,工资 平均 提高 70 元 


. 劳动 生产 率 减少 500 元 ， 工 资 平均 减少 35 元 


E 相 关 与 负 相关 ; 
与 因 变 量 ; 
(5) 回归 系数 与 相关 系数 ; (6) 判决 系数 与 修 ] 





(7) 一 元 线性 回归 分 析 与 多 元 线性 回归 分 析 。 
2. 对 于 下 列 每 一 对 变量 ， 相 关系 数 是 正 的 好 ， eid 
(1) 身高 和 体重 ; 
(4) 劳动 生产 率 和 单位 产品 成 本 ; 














论 对 吗 ? 为 什么 ? 
4. 对 于 给 定 的 一 组 实际 观测 值 ， 
meters 


在 同 归 分 析 的 显著 性 检验 中 检验 与 F 检验 有 
通过 原 上 的 一 元 线性 有 模 只 是 怎样 的 ? 用 最 小 = 党 汉 下 回归 系数 的 人 


7. 解释 总 离 差 平方 和 5 回归 平方 和 和 剩余 平方 御 交 


(2) 职称 和 工资 ; 


8. 在 SPSS 统计 分 析 软件 中 ， 多 元 


们 都 是 采用 最 小 


Sia 


9. 为 了 


三 乘法 求解 ， 主 要 区 别 
数学 成 绩 与 概率 统计 


概率 统计 的 成 绩 ， 如 表 6 - 31 所 示 。 


(3) 抽烟 数 
(5) 福利 条 件 
3. 一 位 研究 者 测量 两 个 变量 的 相关 系数 为 2 判断 这 两 个 变量 不 相关 ， 


各 一 本 人 Linear 过 程 ， 它 


i 


E 判 决 系数 ; 


的 疾病 。 


相关 及 
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"vy 立 起 来 的 回归 方程 ,为 什么 要 进 


EE 有 效 的 ? 


绩 的 关系 ， 现 收集 到 20 名 学 


区 别 ? 





的 含义 ， 并 说 明 它们 之 间 的 关系 。 


上 的 高 等 数学 、 

















表 6-31 学 生成 绩 表 
高 等 数学 78 67 89 76 83 91 74 69 94 66 
概率 统计 74 63 70 75 81 86 67 63 89 62 
高 等 数学 77 86 67 93 85 65 90 83 75 81 
概率 统计 79 88 65 90 78 67 80 91 73 82 








采用 SPSS 统计 分 析 软 件 进行 线性 回归 分 析 ， 





























表 6-32 ANOVA(b) 














得 到 表 6 - 32 和 表 6 - 33 所 示 的 输出 结果 。 











Model Sum of Squares df Mean Square 下 Sig. 
Regression 1252. 095 1252. 095 41. 856 .000(a) 
1 Residual 538. 455 18 29. 914 
Total 1790. 550 19 























a Predictors: (Constant) ， 高 等 数学 ; 


b. Dependent Variable: 


概率 统计 
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表 6-33 Coefficients(a 
Unstandardized Standardized 
Model Coefficients Coefficients t Sig. 
B Std. Error Beta 
(Constant) 8. 184 10. 576 .774 .449 
高 等 数学 .855 .132 .836 6. 470 .000 























a。Dependent Variable: 概率 统计 





(1) 根据 表 6- 32 计算 出 判决 系数 ,解释 判决 系数 的 实际 意义 ; 建立 显著 性 检验 的 零 
假设 和 备 择 假设 ,并 说 明 检 验 的 结论 是 什么 为 什么 ? (a 二 0.05) > 
(2) 根据 表 6 - 33 写 出 估计 回归 方程 ， | x ， 建 立 显著 性 检验 的 













































































零 假 设 和 备 择 假设 ， 并 说 明 检 验 的 结论 是 什么 ?为 什么 a0.05) 
10. 下 面 是 随机 抽取 10 大人 的 上 六 关 数 据 ( 表 6-34) 。 
表 6-34 大 型 商场 销 信 的 同和 各 的 有 关 娄 所 (单位 :元 ) 
企业 编号 销售 价格 Y - “” 购 进 价格 Xi 销售 费用 X 

1 1238 ~ 966 223 

2 1266 894-- 257 

3 ~】 11200> > 387 

1 加 Nos 310 

-一 一 一 一 

5 2 人 ) 1106 Ne r 791 339 

6 Fel 1303 ” 椒 必 852 283 

wi 1313 | 804 302 

8 1144 905 214 

9 1286 771 304 

10 1084 511 326 

采用 SPSS 统计 分 析 软 件 进行 线性 回归 分 析 ， 得 到 表 6 - 35 所 示 输出 结果 
表 6-35 Coefficients(a) 
Unstandardized Standardized 
Model Coefficients Coefficients Sig. 
B Std. Error Beta 

(Constant) 705. 294 502. 316 1. 404 .203 
1 购 进 价格 “383 .303 .804 1. 263 .247 
销售 费用 .738 .988 .476 .747 .479 























a. Dependent Variable: 销售 价格 
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根据 表 6 一 35: 

(1) 写 出 销售 价格 关于 购 进 价格 和 销售 费用 的 估计 回归 方程 。 

(2) 解释 各 个 回归 系数 的 实际 意义 。 

(3) 说 明 购 进 价格 和 销售 费用 对 销售 价格 的 影响 是 否 显著 ? 为 什么 ? (a 二 0.05) 

11. 某 汽车 生产 商 欲 了解 广 告 费 用 X 对 销售 量 的 影响 ， 收 集 了 过 去 12 年 的 有 关 数 据 ， 
通过 SPSS 统计 分 析 软 件 计 算 ， 得 到 表 6 - 36 和 表 6 - 37 所 示 的 结果 。 


表 6-36 ANOVA(b) 






































Sum of 

Model df Mean Square F Sig. 
Squares 

Regression 2.17E-09(a) 
1 Residual 10158 LOL KK 
Total 1642866 | AAA 
a。 Predictors: (Constant)， 广 告 费 用 ; / AR 
b，Dependent Variable: 销售 价格 SS- 


表 6-37% Coefficients(a) 
NY 
AN tandardized 一 
Model 1 > 深 首 t Sig. 
六 Ze VX 


个 ~ Coefficients 
> 和 i 和 
coud ) | 363.69 一 62. 46 5.82 .000 


pi 
广告 绵 用 1.42 杀 盾 .07 19. 98 2.17E-09 
a Dependent Yadiable， 销售 价格 | 











1 























(1) 填 表 完成 表 6 - 36。 

(2) 汽车 销售 量 的 变 差 中 有 多 少 是 由 广告 费用 的 变动 引起 的 ? 
(3) 销售 量 与 广告 费用 的 判决 系数 是 多 少 ? 

(4) 写 出 估计 的 回归 方程 并 解释 回归 系数 的 实际 意义 

(5) 检验 线性 关系 的 显著 性 。(c 一 0. 05) 

(6) 检验 回归 系数 的 显著 性 。(a 二 0. 05) 

















三 、 判 断 是 
1. 当 相关 系数 > 为 正 时 ， 一 元 线性 回归 模型 中 的 回归 系数 也 一 定 为 正 。 ( ) 
2. 在 回归 分 析 中 ， 自 变量 和 因 变 量 都 是 随机 变量 。 ( ) 
3. 变量 zx 与 y 的 相关 系数 为 0.8， 变量 m 与 a 的 相关 系数 为 一 0.9， 则 x 与 y 的 相关 
密切 程度 更 高 。 (C ) 
4. 进行 相关 回归 分 析 . 应 注意 对 相关 系数 和 回归 直线 方程 的 有 效 性 进行 检验 。 


5. 回归 分 析 和 相关 分 析 一 样 ， 所 分 析 的 两 个 变量 都 一 定 是 随机 变量 。 ( ) 
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6. 估计 标准 误差 是 以 回归 直线 为 中 心 反映 各 观测 值 与 估计 值 平均 数 之 间 离 差 程 度 的 
大 小 。 ( ) 
7. 回归 系数 的 绝对 值 小 于 1 。 ( ) 
8. 当 回 归 系 数 大 于 0 时 ， 正 相关 ; 当 回 归 系 数 小 于 0 时 ， 负 相关 。 ( ) 
9. 当 直 线 相关 系数 等 于 0 时 ,说 明 变 量 之 间 不 存在 任何 相关 关系 。 & 
10. 相关 系数 越 大 ， 估 计 标 准 误差 值 就 越 大 ， 从 而 直线 回归 方程 的 精确 性 越 低 。 
( > 


四 、 计 算 题 
1. 5 位 同学 统计 学 的 学 习 时 间 与 学 习 成 绩 如 表 6- 38 所 示 。 
表 6-38 5 位 同学 统计 学 的 学 习 时 间 与 学 习 成 绩 


每 周 学 习 时 数 X 学 习 碱 绩 




















4 AX\M 40 

6 NSD \ 60 

\S 和 50 

10 ~ \™ 70 
F 并 

13 \ 90 


SS 一 一 
Q) 由 此 计算 出 学 习 时 数 与 党 习 幅 绩 之 问 的 相关 系数 、 
(2) 建立 学 习 成 4 关于 学 习 时 数 的 直线 回归 方 各 WX 

(3) 计算 估计 标准 误差 XI 

(4) 若菜 同 学 在 统计 学 上 的 学 习 时 数 为 .5N 让 估计 他 的 学 习 成 绩 。 

2. A 六 的 影响 ， 现 根据 某 商场 2016 年 的 有 关 统 





计 资料 计算 出 以 下 数据 单位， 万 元 )， “| 
> (zi 一 却 )2 一 425053. 73 元 一 647.88 
DB) 0;—3)? = 262855. 25 y= 549.8 


>)(zi 一 二 (yi 一 四) = 334229.09 n= 20 
试 根据 以 上 数据 : 
(1) 拟 合 线 性 回归 方程 ， 并 对 回归 系数 的 经 济 意义 做 出 解释 。 
(2) 计算 判决 系数 和 估计 标准 误差 。 
(3) 对 回归 系数 进行 显著 水 平 为 0.05 的 显著 性 检验 。 
(4) 假定 2017 年 1 月 销售 额 为 800 万 元 ,利用 拟 合 的 回归 方程 预测 相应 的 销售 成 本 ， 
并 给 出 置信 水 平 为 95% 的 预测 区 间 。 
3. 对 某 次 一 元 线性 回归 分 析 得 到 如 下 的 结果 : 
回归 平方 和 SSR 王 680， 自 由 度 f= 二 1 
剩余 平方 和 SSE 二 1205， 自 由 度 f= 二 20 
(1) 在 进行 回归 分 析 时 所 采用 的 观察 值 有 多 少 组 ? 
(2) 根据 上 述 数据 进行 方差 分 析 ， 计 算 下 值 。 




















(3) 说 明 在 进行 方差 分 析 时 下 检验 的 零 假 设 和 备 择 假设 。 
4) 在 显著 性 水 平 为 a==0.05 时 ， 说 明 回归 方程 是 否 有 效 。 
4. 已 知 变量 X 与 了 的 观测 值 及 有 关 计 算 过 程 如 表 6 一 39 所 示 。 


( 


( 








1) 计算 并 填 表 6 一 39。 


表 6-39 XX 与 Y 的 观测 值 及 有 关 计算 过 程 


相关 及 
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XxX = 0 0 2 1 元 一 

0 1 一 2 0 1 5= 
x 7? 
Y? 

xr Zzriyi= 

















(2) 计算 Sy 和 5S。 x < s 


























(3) 利用 表 中 数据 计算 回归 系数 及 常数 项 。 RS 
(4) 写 出 所 求 出 的 线性 回归 方程。 AL 
(5) 计算 判决 系数 R? 。 
5. 某 种 产品 的 产量 ee 2 vk. 
表 6-40 量 与 单位 成 本 资料 
A KS A 
2 
Se 4 X i 1 72 
Se 达 71 
< 1 .六 | 3 
NA 区 御 69 
5 68 








6. 


某 冰 箱 生 产 厂 家 认为 ， 冰 箱 销售 额 Y( 











告 费 


归 方 程 为 = 一 98. 2457 十 11. 0537X1 十 0. 639X2z， 





统计 量 的 值 分 别 为 ta 一 2. 6562，tbz 一 0. 5963。 


( 





) 计算 相关 系数 r-， 判断 其 相关 方向 和 程度 。 
(2) 建立 单位 成 本 关于 产量 的 直线 回归 方程 。 
(3) 指出 产量 每 增加 1000 件 时 ,单位 成 本 平均 下 降 了 多 少 元 ? 
万 元 ) 与 推销 人 员 数 XI( 人 ) 和 所 支出 的 广 
目 Xz (万 元 ) 有 一 定 的 关系 。 根据 2006 一 2016 年 的 有 关 统 计数 据 建 立 的 二 元 线性 回 
并 已 计算 出 Xi 和 XX; 的 回归 系数 检验 的 


(2) 试 解释 XX! 入 ;的 回归 系数 的 实际 意义 。 


) 试 分 析 说 明 推 销 人 员 人 数 和 广告 费用 对 销售 额 的 影响 是 否 显 著 ? (a 二 0. 05) 








7. 设立 和 X 之 间 近 似 满足 Y 一 a 十 如， 现 给 出 数据 资料 如 表 6- 41 所 示 。 

表 6-41 Y 和 XX 的 数据 资料 
区; 56.7 44.5 38.5 38.5 人 1 
ww td 185 190 180 184 196 
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(1) 求 Y 对 X 的 回归 方程 。 








(2) 求 了 与 支 之 间 的 相关 系数 。 
8. 某 地 区 近 几 年 来 职工 月 均 收入 与 用 于 智力 投资 的 统计 数据 如 表 6 - 42 所 示 。 

表 6-42 职工 月 均 收 入 与 用 于 智力 投资 的 统计 (单位 : 百 元 ) 
月 均 收入 X 35 46 50 64 83 89 90 95 
智力 投资 了 5 4 7 11 16 18 19 22 









































分 别 用 求 出 相应 的 非 线性 回归 方程 ， 并 通过 估计 标准 误差 的 计算 ， 比 较 不 同 曙 线 拟 合 
下 的 优 劣 。 























(1) 震 函 数 昌 线 了 一 <X2. 人 险 
(2) 指数 函数 函数 * 一 eeix «\ 
五 、 上 机 实验 是 


1. 要 研究 成 人 年 龄 与 era 与 血压 如 
表 6-43 所 示 。 
































编 号 SN 1 血 压 

En 3 | 
1 J AN 30 多 | 73 

; 的 nA 
> E > 一 50 

) _ 
3 3? 60 128 
< 一 一 

> [ 50 170 
了 40 87 
6 50 108 
2 60 135 
8 30 69 
9 70 148 
10 60 192 











(1) 绘制 成 人 年 龄 与 血压 的 散 点 图 ,判断 二 者 之 间 的 关系 。 

(2) 计算 成 人 年 龄 与 血压 的 相关 系数 。 

(3) 对 相关 系数 进行 显著 性 检验 ， 并 说 明 二 者 之 间 的 关系 密切 程度 。(c 一 0. 05) 

2. 某 公 司 打算 在 某 地 推出 一 种 新 产品 ,为 了 确定 该 地 区 影响 消费 者 购买 行为 的 主要 
因素 以 便 更 准确 地 进行 定价 决策 和 制定 产品 营销 策略 ， 而 对 某 地 区 进行 了 部 分 抽样 调查 
在 一 个 月 的 试销 期 间 经 过 分 析 (影响 该 地 区 消费 者 购买 的 主要 因素 包括 每 月 家 庭 可 支配 收 
入 、 实 际 收 入 、 购 买 者 年 龄 、 家 庭 成 员 数 等 ) 得 到 如 表 6 - 44 所 示 数 据 。 
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表 6-44 公司 调查 数据 
月 家 庭 可 支配 
月 家 庭 实际 收入 Xi 是 否 购买 Xs 家 庭 成 员 数 X 
收入 X2 
41 306 299 0( 不 买 ) 1 
45 340 332 0( 不 买 ) 1 
41 429 419 0( 不 买 ) 1 
41 316 300 0( 不 买 ) 1 
45 341 322 0( 不 买 ) 1 
41 430 425 0( 不 买 ) 1 
39 492 491 0( 不 买 ) , 1 
39 482 2 
32 508 1 
32 530 2 
33 642 1 
45 889 1 
43 1108 1 
40 1191 0( 不 买 ) 1 
39 1518 x (不 买 ) 2 
46 1741 wh 1543 Ys XI 不 买 ? 2 
38 1937 "5 1628 I 0( 不 买 ) 2 
38 _r2183 一 1854 SS 1( 买 ) 
TY 
44 EY: RD 1( 买 ) 2 
二 
39 > 3983 3 0( 不 买 ) 3 
26 6008 4442 1( 买 ) 3 
45 7274 5566 1( 买 ) 3 
40 8353 6545 0( 不 买 ) 3 
35 9068 7189 1( 买 ) 4 
30 9193 7912 1( 买 ) 
44 9491 7493 1( 买 ) 4 
47 10921 7997 1( 买 ) 5 
35 11991 9463 1( 买 ) 6 
36 12969 9396 1( 买 ) 6 
30 9143 8012 1( 买 ) 3 
44 9591 7693 1( 买 ) 3 
47 10121 8997 1( 买 ) 4 
35 11951 9363 1( 买 ) 6 
36 13969 8396 1( 买 ) 5 
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试 通过 相关 分 析 确 定 月 家 庭 实 际 收入 是 否 是 影响 消费 者 购买 行为 的 重要 因素 。(a 二 0. 05) 
3. 有 10 个 同类 企业 的 生产 性 固定 资产 年 平均 价值 和 工业 总 产值 资料 如 表 6 - 45 所 示 。 





表 6-45 10 个 同类 企业 的 生产 性 固定 资产 年 平均 价值 和 工业 总 产值 资料 



































企业 编号 生产 性 固定 资产 价值 X/ 万 元 工业 总 产值 Y/ 万 元 
1 318 524 
2 910 1019 
3 200 638 
4 409 815 
5 415 913 
6 502 928 
314 605 
8 1210 r KS 1516 
9 1022 SS 1219 
10 1225 < | 1624 











(1) 求 了 


(3) 进行 回归 方程 的 显著 性 检验 。(& 二 


[ 业 总 产值 关于 生产 性 固定 资产 “年末 声优 人 49 直线 回归 方程 。 
(2) 计算 判决 系数 及 估计 标准 误差 。 - XN 











) 








4. 某 企业 希望 了 解 每 周 的 产品 广 Be 售 额 之 间 的 关系 ,记录 了 如 表 6 一 46 所 示 数 据 。 


1 表 646 6 广告 与 销售 才 数 帝 | 、 (单位 : 万 元 ) 








(1) 求 广告 费 与 nln 并 分 析 二 者 之 间 的 相关 方向 和 相关 程度 。 
























































(2) 试 建立 线性 回归 方程 。 

(3) 检验 回归 系数 是 否 显著 。(a 二 0. 05) 

5. 一 家 商店 在 10 个 地 区 设 有 经 销 分 公司 。 公 司 认为 商品 销售 额 与 该 地 区 的 人 口 数 和 年 人 
均 收 入 有关 ， 并 希望 建立 它们 之 间 的 数量 关系 式 ， 以 预测 销售 额 。 有 关 数 据 资料 如 表 6 - 47 
所 示 。 

表 6-47 相关 数据 
地 区 编号 销售 额 Y/ 万 元 人 口 数 Xi /万 人 年 人 均 收 入 Xa/ 百 元 
1 33.3 32.4 12.5 
2 35.5 29.1 16.5 
3 27.6 26.3 15, 5 
4 30.4 31:2 131 
5 21.9 29.2 13.1 
6 53.1 40.7 15.8 
7 35.6 29.8 14.9 
8 29.0 23.0 15.2 
9 35.1 29.2 16.2 
10 34.5 26.9 15.7 

























































































相关 及 回归 分 析 

(1) 试 确定 销售 额 对 人 口 数 和 年 人 均 收 入 的 线性 回归 方程 。 
(2) 分 析 回归 方程 的 拟 合 程度 。 
(3) 进行 回归 方程 的 显著 性 检验 。(o 一 0. 05) 
(4) 进行 各 回归 系数 的 显著 性 检验 。(a 二 0. 05) 
6. 设 有 自 变量 X 和 因 变 量 Y 的 观测 数据 如 表 6 - 48 所 示 。 

表 6-48 自 变量 X 和 因 变 量 Y 的 观测 数据 
x 2 3 4 5 六 8 10 
We 106. 42 108.2 109. 58 109.5 110.0 109. 93 110. 49 
x 11 14 15 16 18 19 
4 110. 59 110. 60 110. 90 110. 76 11 0 111.2 
1) 用 倒数 曲线 拟 合 立 关于 X 之 间 的 关系 。 忆 
(2) 用 对 数 遇 线 拟 合 立 关于 X 之 间 的 关系 。 i 
(3) 说 明 哪个 曲线 拟 合 程度 更 好 。 - 


NN 
i 上 实际 操作 训练 AR 


1. 实 训 项 目 : 复习 时 间 与 考试 度 结 的 关系 判断 。 
sR 





实 训 目的 ,学 会 运用 相关 分 析 的 原理 和 方法 解 
实 训 内 容 : 0 和 间 和 考试 成 绩 进行 调查 ， 收集 数据 


要 求 :利用 SPSS 统计 分 析 软 件 ， 首 稚 颖 的 这 3 时 间 和 考试 成 绩 的 艇 点 i 图， 并 判断 二 
者 之 间 大 休 量 入 人 的 关系 然后 计算 复 当时 间 和 考试 成 绩 的 简单 相关 系数 并 进行 显著 性 
检验 ， 分 析 能 否 福 出 复习 时 间 越 长 考试 成 绩 越 高 的 结论 。 

2. 实 训 项 目 ， 父母 身高 与 子女 身高 的 回归 分 析 。 

实 训 目的 ， 学 会 运用 一 元 线性 (或 非 线性 ) 回归 分 析 的 原理 和 方法 解决 实际 问题 。 

实 训 内 容 ， 旱 在 19 世纪 后 期 ， 英 国生 物 学 家 高 尔 顿 通过 观察 1078 个 家 庭 中 父亲 、 母 
末 身 高 的 平均 值 x 和 其 中 一 个 成 年 儿子 身高 y， 建 立 了 关于 父母 身高 与 子女 身高 的 线性 方 
程 ， 即 > 王 33.73 十 0.516r。 从 方程 可 以 看 出 ,子女 身高 有 回归 平均 的 倾向 。 那 么 ， 时 隔 
一 百 多 年 后 的 今天 ， 人 类 的 物质 生活 和 精神 生活 都 已 发 生 巨 大 的 变化 ， 父 母 身高 与 子女 身 
高 之 间 将 呈现 出 什么 样 的 关系 呢 ? 

请 调查 本 班 学 生 及 其 父母 身高 的 相关 数据 ， 利 用 SPSS 统计 分 析 软 件 ， 仿 照 高 尔 屯 的 
方法 拟 合身 高 的 回归 方程 ， 并 评价 及 检验 方程 的 优 劣 。 

3. 实 训 项 目 ， 中 国 GDP 的 影响 因素 分 析 及 预测 。 

实 训 目的 ， 学 会 运用 多 元 线性 回归 分 析 的 原理 和 方法 解决 实际 问题 。 

实 训 内 容 ， 分 小 组 讨论 ，GDP 在 地 区 层次 上 称 为 地 区 生产 总 值 ， 它 受 多 种 因素 的 影 
响 ， 如 进出 口 总 额 、 国 定 资产 投资 、 社 会 消费 品 零售 总 额 等 。 请 查阅 《中 国 统计 年 鉴 )。 
获取 近 15 年 的 相关 数据 ， 以 中 国 GDP 预测 量 为 目标 ， 进 行 多 元 线性 回归 分 析 
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要 求 : 以 GDP 作为 因 变 量 , 确定 至 少 3 个 与 GDP 相关 的 自 变 量 ， 然 后 借助 SPSS 工 
具 ， 建 立 回归 模型 ， 进 行 参数 估计 ， 并 进行 有 关 的 显著 性 检验 ， 最 后 预测 我 国 未 来 5 年 
GDP 值 并 写 出 分 析 报告 。 


[LE 宁 例 思考 与 讨论 




















基于 供给 模型 的 天 津 市 高 等 教育 发 展 规模 的 实证 分 析 


高 等 教育 适度 的 发 展 规模 应 该 是 既 能 够 最 大 程度 地 满足 社会 和 居民 对 高 等 教育 的 连 
切 需求 ， 又 能 够 与 现 阶段 经 济 发 展 水 平 相 适 应 。 在 我 国 实行 市 场 经 济 的 条 件 下 ， 由 政府 
教育 部 门 决定 高 等 教育 供给 的 决策 方式 。 影 响 高 等 教育 的 供给 因素 有 很 多 ， 如 经 济 发 展 
0 
od eb spr 选择 天 津 市 普通 高 等 
学 校 在 校生 人 数 作为 发 展 规模 变量 ， 选 择 天 津 市 的 GDP 和 普通 高 等 学 校 专任 教师 数 作 
为 发 展 规模 的 主要 影响 变量 。《2015 天 津 统计 年 鉴 汽 公布 的 1999 一 2014 年 的 数据 资料 
如 表 6 -49 所 示 。 SS- 


,\N 
表 6-49 1999 一 2014 年 天 津 1 . 裔 竺 教育 发 展 规模 供给 变量 数据 
年 份 在 校生 数 Y/ 万 人 GDP Xi/ 亿 元 专任 教师 数 X/ 万 人 


















































1999 9. oo XK 1 1500. ERR 0.9647 
2000 1F760d 和 1 38X 1.0137 
2001 Ka.3998 0 1. 2552 
2002 2 仿 N19.6892 多 A 76 1.4175 
2003 NX 户 24. 5213 下 人 内” 2578.03 1. 5553 
2004 /4 28. 6145 3110. 97 1. 8973 
2005 33. 1553 3905. 64 2. 167 
2006 35.7382 4462. 74 2. 4464 
2007 37. 1136 5252. 76 2. 5166 
2008 38. 6437 6719. 01 2. 6169 
2009 40. 5968 7521. 85 2.7118 
2010 42. 9224 9224. 46 2. 8094 
2011 44. 9702 11307. 28 2. 8919 
2012 47. 3114 12893. 88 2. 9929 
2013 48. 9919 14442. 01 3.09 

2014 50. 5795 15726. 93 3. 1008 














(1) 对 1999 一 2014 年 在 校生 数 与 GDP 和 专任 教师 数 进行 相关 分 析 ， 探 求 GDP 和 专 
任教 师 数 对 高 校 在 校生 数 的 促进 作用 。 
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(2) 建立 二 元 线性 回归 分 析 模 型 ， 并 根据 回归 系数 的 经 济 意义 分 析 GDP 和 专任 教师 
数 对 高 校 在 校生 数 的 贡献 大 小 。 

(3) 计算 基于 供给 模型 的 天 津 市 高 校 发 展 规模 预测 值 ， 并 与 天 津 市 高 校 发 展 规模 实际 
值 进行 对 比分 析 。 

(4) 在 前 面 实例 分 析 中 已 经 计算 出 1999 一 2014 年 基于 需求 回归 模型 的 天 津 市 高 校 发 
展 规模 预测 值 ， 将 其 与 基于 供给 回归 模型 的 天 津 市 高 校 发 展 规模 预测 值 进行 对 比 ， 分 析 天 
津 市 高 等 教育 发 展 的 供需 关系 及 差异 。 
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通过 本 章 的 学 习 ， 
件 的 操作 步骤 ， 学 会 利用 这 些 方法 解决 实际 问题 。 / A 


聚 类 分 析 


正确 理解 聚 类 分 析 的 基本 理论 ， 掌 


NT- 


松 


CO DL SPSS 软 


| 才学 要 于 让 
知识 要 点 相关 知识 





ss 





理 ， 思想 及 基 | 
聚 类 分 析 的 基本 能 够 解 取 ; 煌 的 基本 思想 及 基 江 条 类 、Q 型 于 类 
思想 本 步骤 rz 
WX x 
能 脑 吾 所 描述 样品 间 、 指 5 
pr 六 品 间 、 9 
分 类 统计 量 > - Ee 距离 、 相 似 系数 


的 分 类 统计 芋 2 








YY ~ 
Ne A 
i 步骤 ， 间距 离 、 系 分 
系统 聚 类 法 “ 能 够 过 手 系 统 荣 类 分 析 的 基本 岁 队 类 间距 离 、 系 统 聚 类 分 析 的 算法 
并 运用 它 解决 实际 问题 步 也 
练 SPSS 之 系统 “Classify” 选 项 、 “Hierarchic 
SPSS 软件 操作 能 够 熟练 使 用 SPSS 软件 之 系统 聚 类 Classify” 选 项 Hierarchical 





分 析 功 能 并 对 输出 结果 进行 正确 解读 





Cluster Analysis” 对 话 框 


聚 类 分 析 是 根据 研究 对 象 的 特性 ， 对 它们 进行 定量 分 类 的 一 种 多 元 统计 方法 。 它 能 够 将 一 
批 样 品 或 变量 ,按照 它们 在 性 质 上 的 亲政 程度 进行 分 类 。 类 内 部 的 个 体 在 特征 上 具有 相似 性 ， 
不 同类 间 个 体 特征 的 差异 较 大 。 聚 类 的 目的 是 从 中 发 现 规律 性 ， 进 而 达到 认识 和 改造 世界 的 目 
的 。 本 章 结 合 SPSS 统计 软件 ,介绍 聚 类 分 析 中 常用 的 系统 聚 类 法 。 
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我 国 各 省 市 的 土地 利用 情况 分 析 


土地 是 民生 之 本 ， 发 展 之 基 ， 财 富 之 源 。 人 类 社会 的 进步 、 经 济 的 发 展 和 财富 的 积累 ,无 不 与 土地 息 息 相 
关 。 中 国人 多 地 少 的 矛盾 突出 ， 土 地 问题 始终 是 现代 化 发 展 进程 中 带 有 全 局 性 、 根 本 性 、 战 略 性 的 重大 问题 。 
20 世纪 80 年 代 以 来 ， 我 国政 府 把 土地 利用 规划 作为 管理 土地 资源 的 龙头 ， 先 后 在 全 国 开展 了 两 轮 土地 利用 规 
划 的 编制 。 土 地 利用 规划 是 否 科学 、 合 理 ， 是 否 可 持续 ， 将 会 对 社会 经 济 活动 的 各 个 方面 产生 深刻 影响 。 而 制 
定 土地 利用 规划 ， 必 须 有 准确 、 全 面 的 土地 利用 数据 。 自 2000 年 以 来 国土 资源 部 先后 组 织 开展 16 次 卫 片 执 
法 工作 。2015 年 的 卫 片 执法 全 国共 查处 土地 违法 案件 12. 66 万 宗 ， 涉 及 土地 面积 90.41 万 亩 ， 糙 地 面积 33. 98 
万 亩 。26 个 省 级 政府 警示 约 谈 了 29 个 市 、142 个 县 。 四 he a 
183 起 、 公 开通 报 了 107 起 重大 、 典 型 违法 案件 。 RS “ 卫 片 执法 ”是 通 
过 卫星 录 感 等 技术 ， 可 以 将 一 Oe ee dn Ei 间 的 卫星 图 片 进 
行 得 加 对 比 ， 哪 里 有 违 建 ， 哪 里 乱 占 耕地 ， 都 可 以 一 目 目 了 然 地 此 次 卫星 胸 感 的 区 域 主要 包括 省 、 
自治 区 、 直 辖 市 政府 所 在 地 城市 ， yeeros 站 了 Re 那么 ， 我们 是 否 可 以 根据 已 有 
数据 对 全 国 31 个 省 、 自 治 、 直 辖 市 的 土地 利用 情况 作为 制定 土地 利用 规划 的 参考 。 

资料 来 源 ， 半 月 谈 网 谈天 下 .http: ory teed ee one Ad noted tt shtml, 
2016 年 4 月 26 日 。 SS 


在 经 济 、 社 会 、 AR 桨 造 分 类 模式 的 问题 。 例 如 ， 在 经 
济 研究 中 ， 为 了 研究 不 同 地 区 城 放 居民 生活 中 的 收入 及 消 4 况 ， 往 往 需要 划分 为 不 同 的 类 
型 去 研究 ， 在 人 口 研究 中 K 需 要 和 构造 人 口 生育 :机 直 。 入口 死亡 分 类 函数 ， 以 此 来 研究 人 
口 的 生育 和 死亡 规律 个 过 去 人 们 主要 依靠 经 验 和 专业 知识 做 定性 分 类 处 理 ， 致 使 许多 分 类 
带 有 主观 性 和 任意 性 人 不 能 很 好 地 揭示 客观 要 物 内 在 的 本 质 差别 和 联系 ,特别 是 对 于 多 因 
素 、 多 指标 的 分 题 ， 定 性 分 类 更 难以 实现 准确 分 类 。 于 是 统计 这 个 有 用 的 工具 和 逐渐 被 引 
入 分 类 学 ， 形 成 了 数值 分 类 学 。 近 些 年 来 ， 数 理 统计 的 多 元 分 析 方法 有 了 迅速 的 
发 展 ， 多 元 分 析 的 技术 被 引入 分 类 学 中 ， 于 是 从 数值 分 类 学 中 逐渐 分 离 出 聚 类 分 3 





析 这 个 新 的 分 支 。 聚 类 分 析 能 将 个 体 或 对 象 分 类 ， 使 得 同一 类 中 的 对 象 之 间 的 相 
似 性 比 与 其 他 类 的 对 象 的 相似 性 更 强 ， 目 的 在 于 使 类 间 对 象 的 同 质 性 最 大 化 和 类 


加 





与 类 间 对 象 的 异 质 性 最 大 化 。 可 见 ， 聚 类 分 析 方法 可 以 解决 上 述 问题 。 I Ay 
7.1 聚 类 分 析 概 述 

7.1.1 什么 是 聚 类 分 析 

@ 阅读 案例 7-! 
如 何 对 消费 者 进行 分 类 ? 


Chrysler 公司 为 了 赢得 市 场 竞争 地 位 ， 决 定 推出 新 产品 Viper， 该 产品 的 目标 客户 是 雅 皮 士 阶层 。 为 
了 进一步 了 解 这 种 人 群 的 心理 特征 ， 定 位 自己 的 产品 ， 叹 引 目标 客户 ，Chrysler 公司 进行 了 一 次 市 场 调 
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研 。 研究 者 调查 400 名 被 试 者 对 30 项 陈述 的 态度 ， 从 而 了 解 这 些 目标 客户 的 心理 特征 。 调 查 还 询问 被 试 
者 对 Dodge Viper 型 汽车 的 看 法 来 测试 消费 者 对 “我 愿意 购买 Chrysler 公司 生产 的 Dodge Viper 型 汽车 ” 
的 态度 。 最 终 ， 应 用 聚 类 分 析 方 法 将 克莱斯勒 公司 的 目标 客户 分 成 了 3 种 类 型 : 年 轻 创 业 型 、 中 产 稳健 
型 、 保 守 低调 型 。 这 3 种 类 型 的 消费 者 各 自 具有 自己 的 独特 特征 。 克 莱 斯 勒 公司 将 针对 他 们 不 同 的 特征 
和 消费 心理 制定 了 不 同 的 营销 策略 。 

年 轻 创 业 型 的 消费 者 对 将 来 预期 乐观 ， 有 奋斗 精神 ， 他 们 有 较 强 的 社会 和 家 庭 责任 感 。 目 前 经 济 情 
况 一 般 ， 消 费 态 度 较为 谨慎 。 这 部 分 人 对 克莱斯勒 汽车 的 态度 最 为 友好 ， 是 公司 主要 的 目标 客户 群 。 同 
时 ， 这 部 分 人 极 具 成 长 潜力 。 公 司 应 该 针对 这 部 分 人 的 经 济 情 况 和 消费 心理 ,推出 时 尚 创 新 、 价 格 适中 
的 汽车 。 在 广告 的 诉求 上 ,应 该 针对 这 部 分 人 的 心理 特征 ， 强 调 社 会 和 家 庭 责 任 感 。 同 时 ,公司 应 该 关 
注 这 部 分 人 的 成 长 ， 尽 力 吸引 其 顾客 忠诚 度 ， 因 为 将 来 这 部 分 人 进入 中 年 ， 经 济 状况 改善 有 可 能 成 为 
克莱斯勒 公司 高 档 轿车 的 主要 消费 群 。 

中 产 稳健 型 的 消费 者 对 克莱斯勒 公司 汽车 的 态度 较 好 。 公 司 应 该 针对 部 分 人 的 需求 ， 推 出 注重 舒 
适 和 享受 ,价格 较 高 ， 质 量 高 档 的 轿车 。 在 广告 诉求 和 产品 宣传 上 ,， 不 爱国 的 因 来 ， 从 情感 和 经 
济 两 方面 打动 消费 者 。 

ts ON 但 
是 也 不 能 忽视 ， 因 为 他 们 在 总 的 消费 群 中 的 比例 相当 大 了: 加 强 对 他 们 的 宣传 和 交流 ， 提供 关于 
公司 产品 的 更 多 信息 ， 强 调 克 莱 斯 勒 公司 汽车 稳健 Nr 以 吸引 这 部 分 消费 者 。 

资料 来 源 ， 百 度 文库 .https: //wenku. baidu. i 


和 如 能 把 它们 分 成 若干 类 来 处 理 ， 就 很 方便 。 
取 类 分 析 的 目的 就 是 把 相似 的 东 汕 尖 记 类 。 例 如 ， 大 学 之 疗 根据 师资 、 设 备 、 学 生 情况 
可 以 划分 为 一 流 大 学 ， 二 流 大 学 等 ， 0 发 
eh 几 类 区 域 ， 学 生根 据 各 科 的 学 习 情 
况 可 以 划分 为 几 种 类型 等 。 这 些 就 是 一 些 分 类 问题 ， 肾 类 分 析 就 是 解决 这 些 分 类 的 有 效 
方法 之 一 。 A ,| Ds 

隧 类 分 析 实 计 上 是 寻找 一 种 能 客观 反映 元 素 之 间 亲 牙关 系 的 统计 量 ， 然 后 根据 这 种 统 
计量 把 元 素 分 成 若干 类 。 常 用 的 聚 类 统计 量 有 距离 系数 和 相似 系数 两 类 。 距 离 系 数 一 般 
于 对 样品 分 类 ， 而 相似 系数 一 般 用 于 对 变量 刘 类 。 聚 类 分 析 的 基本 思想 是 在 样品 之 问 定义 
距离 ， 在 变量 之 间 定 义 相似 系数 ， 距 离 或 相似 系数 代表 样品 或 变量 之 间 的 相似 程度 。 按 和 
加 和 6 加 。 似 程度 的 大 小 ,将 样品 或 变量 ) 逐一 归 美 ， 关 系 密切 的 类 聚集 到 一 个 小 的 
波状 分 类 单位 ， 然 后 逐步 扩大 ， 使 得 关系 牙 远 的 聚合 到 一 个 大 的 分 类 单位 ， 直 到 
开光 所 有 的 样品 (或 变量 ) 都 聚集 完毕 ， 形 成 一 个 表示 亲疏 关系 的 谱系 图 ， 依 次 
[拓展 知识 】 按照 某 些 要 求 对 样品 (或 变量 ) 进行 分 类 。 



































7.1.2 聚 类 分 析 的 目的 


在 实际 研究 中 ， 既 可 以 对 样品 进行 聚 类 ， 也 可 以 对 研究 变量 进行 聚 类 。 对 样品 进行 的 
聚 类 通常 称 为 Q 型 聚 类 ， 对 研究 变量 进行 的 聚 类 称 为 R 型 聚 类 。 例 如 ， 根据 考核 高 等 院 
校 的 多 项 指标 一 学 校规 模 、 师 资 情况 、 教 学 科研 水 平等 ， 可 以 将 全 国 多 所 高 等 院 校 划分 为 
重点 院 校 、 普 通 院 校 等 类 别 。 这 就 是 对 样品 进行 聚 类 〈Q 型 聚 类 )。 对 某 些 高 等 院 校 的 办 
学 水 平 进行 考察 ， 而 反映 办 学 水 平 的 指标 很 多 ， 有 学 校规 模 指标 、 师 资 情况 指标 、 教 学 水 
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平 指标 、 科 研 水 平 指标 等 等 ， 通 常 先 对 这 些 指 标 进行 分 类 ， 然 后 再 做 进一步 分 析 。 这 就 是 
对 指标 进行 聚 类 (R 型 聚 类 ) 。 
Q 型 聚 类 分 析 的 目的 如 下 : 
(1) 可 以 综合 利用 多 个 变量 的 信息 对 样品 进行 分 类 。 
(2) 通过 聚 类 谱系 图 非常 清楚 直观 地 表现 其 分 类 结果 。 
(3) 能 够 得 到 比 传统 分 类 方法 更 细致 、 全 面 、 合 理 的 结果 。 
R 型 聚 类 分 析 的 目的 如 下 : 
(1) 可 以 了 解 变量 间 及 变量 组 合 间 的 亲 玻 关系 。 
(2) 对 变量 进行 分 类 。 
(3) 根据 变量 的 分 类 结果 以 及 它们 之 间 的 关系 ,在 每 一 类 中 选择 有 代表 性 的 变量 作为 
重要 变量 ， 进 一 步 分 析 和 计算 ， 如 进 0 








7.1.3 聚 类 分 析 的 基本 步骤 


进行 聚 类 分 析 一 般 包 括 以 下 几 个 基本 步 又; ， 和 

wa 的 变量 既 要 能 够 全 面 反映 对 象 性 质 
的 各 个 方面 ， 又 要 使 不 同 变量 反映 的 对 象 性 质 有 所 差别 。 

(2) 建立 样品 数据 资料 算 阵 ， SS 

(3) 确定 数据 是否 要 慰 准 化 ~ 阅 量 的 单位 经 常 在 过 样 ， 有 时 不 同 变量 的 数值 差别 
很 大 ， 这 时 如 果 不 做 数据 标准 伦 处 理 ， 数 值 较 小 的 变 在 加 时 象 的 距离 或 相似 性 时 其 作 





用 会 严重 削弱 ， 从 而 影响 分 类 的 正确 性 。 
(4) 确定 表示 对 象 距 离 或 相似 程度 的 统计 回 & 完 回 
(5) 选择 适当 的 谨 类 方法 ， 进 行 聚 类 ?| eh 





聚 类 分 析 :很 多 ， 我 们 重点 介绍 系统 于 类 法 ， 作为 聚 类 分 析 的 出 发 ” 国 
点 ， 先 介绍 分 类 统计 量 一 一 距离 和 相似 系数 。 【期 刊 推荐 】 


(人 patnl7-2 





聚 类 分 析 方 法 的 起 源 与 产生 


俗话 说 :“ 物 以 类 聚 ， 人 以 群 分 "， 在 自然 科学 和 社会 科学 中 ， 存 在 着 大 量 的 分 类 问题 。 所 谓 类 ， 通 
俗 地 说 ， 就 是 指 相似 元 素 的 集合 。 聚 类 分 析 又 称 群 分 析 ， 它 是 研究 〈 样 品 或 指标 ) 分 类 问题 的 一 种 统计 
分 析 方法 。 聚 类 分 析 起 源 于 分 类 学 ， 但 是 聚 类 不 等 于 分 类 。 聚 类 与 分 类 的 不 同 在 于 ， 聚 类 所 要 求 划分 的 
类 是 未 知 的 。 在 古老 的 分 类 学 中 ， 人 们 主要 依靠 经 验 和 专业 知识 来 实现 分 类 ， 很 少 利用 数学 工具 进行 定 
量 的 分 类 。 随 着 人 类 科学 技术 的 发 展 ， 对 分 类 的 要 求 越 来 越 高 ， 以 致 有 时 仅 凭 经 验 和 专业 知识 难以 确切 
地 进行 分 类 ， 于 是 人 们 逐渐 地 把 数学 工具 引用 到 了 分 类 学 中 ， 形 成 了 数值 分 类 学 ， 之 后 又 将 多 元 分 析 的 
技术 引入 到 数值 分 类 学 形成 了 聚 类 分 析 。 聚 类 分 析 内 容 非常 丰富 ， 有 系统 聚 类 法 、 模 糊 聚 类 法 、K -均值 

资料 来 源 : 何 晓 群 . 多 元 统计 分 析 [M]. 2 版 . 北京 : 中 国人 民 大 学 出 版 社 ，2008. 
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7.2 分 类 统计 量 


7.2.1 数据 资料 矩阵 的 标准 化 处 理 


我 们 知道 根据 变 量 取 值 的 不 同 ， 变 量 可 以 分 为 3 类， 间隔 尺度 变量 、 有 序 尺度 变量 
和 名 义 尺度 变量 。 间 隔 尺度 变量 〈 定 量变 量 ) 用 连续 的 量 来 表示 ， 如 长 度 、 距 离 、 质 量 和 
产量 等 。 有 序 尺度 变量 〈 定 序 变 量 ) 用 等 级 来 表示 ， 例 如 ， 产 品质 量 分 为 上 、 中 和 下 3 个 
等 级 ， 等 等 。 名 义 尺度 变量 〈 定 类 变量 ) 用 一 些 类 来 表示 ， 如 人 的 职务 、 性 别 等 。 在 实际 
应 用 中 经 常 遇 到 的 是 具有 数值 特性 的 变量 (或 指标 )， 因 此 本 章 重点 介绍 定量 变量 的 聚 类 
分 析 方 法 。 人 

假设 及 个 样品 ， 样 品 号 为 1,2.3….n， 每 个 样品 测量 ,ww 个 变 儿 > (或 指标 )X1 ,Xs，…… 
X ， 数 据 资料 矩阵 为 ‘NN\ 




















[xX xX: xX: ,Re 
1 | zl zl2 TR NY Tum 


2 | zzl 












为 消除 各 个 变量 所 用 量 允 的 影响 ， 


以 保证 各 变 
和 矩阵 做 标准 化 处 理 。， 站 一 \ 4 





Ar (7-1) 
WK 
NN 
sj 一 (7-2) 
7 Ti 2 
2 一 (i=1,2,° ,1;j=1,2,°,m) (7-3) 





变换 后 各 指标 均值 为 0 标准 差 为 1。 根 据 实际 问题 的 需要 考虑 是 否 进行 数据 资料 的 
标准 化 处 理 ， 然 后 再 进行 聚 类 分 析 。 


7.2.2 距离 和 相似 系数 


回 ma] 1. 距离 


党 距离 是 常常 用 来 描述 样品 间 亲 玻 程 度 的 分 类 统计 量 ， 它 是 将 每 个 样品 
ok 成 是 m 维 空间 中 的 一 个 点 ,并 在 空间 中 定义 距离 。 距 离 较 近 的 点 归 为 一 类 ， 


【拓展 知识 】 ”距离 较 远 的 点 归属 于 不 同 的 类 。 
第 i 号 样品 与 第 j 号 样品 之 间 的 距离 记 为 d; ， 一 般 要 求 dz 满足 如 下 4 个 条 件 : 
(1) dj; 之 0， 对 于 一 切 i, j。 
(2) di 二 0， 等 价 于 第 i 号 样品 与 第 j 号 样品 的 各 指标 相同 。 
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(3) dj ==dj;， 对 于 一 切 i,j。 
(4) djdx+diy ， 对 于 一 切 i, j,k 
在 聚 类 分 析 时 ， 有 些 距离 并 不 满足 第 4 个 条 件 ， 但 广义 地 称 它 为 距离 。 下 面 介绍 聚 类 
分 析 中 常用 的 距离 计算 公式 。 
1) 闵 氏 (Minkowski) 距离 











a = [9 lea zl 07-4) 
k=1 
当 k==1 时 ， 为 绝对 值 距离 ， 即 
好 二 8 
(7 一 全 





闵 氏 距离 是 用 得 很 多 的 一 种 距离 ， teat 潭 欧 氏 距离 最 常见 、 也 最 直观 。 闵 
氏 距 离 适 用 于 一 般 p 维 欧 氏 空间 。 -2 虑 变量 之 间 的 相关 性 。 
2) 马 氏 (Mahalanobis) 距离 / 


地 RN )Ts -i(zi—z)) (7-7) 
式 中 ，S= (5 ) tm ，ZX; 和 元 分 别 为 第 i 号 


样品 和 第 j 号 样品 各 指 
马 氏 距离 适用 于 街 量 KE 人 的 engi 它 排除 了 各 变量 之 
间 的 相关 性 的 填 扰 > 下 < 
/ 
2. 相似 系 


相似 系数 是 常常 用 来 描述 指标 间 亲 朴 程 度 的 分 类 统计 量 。 两 个 变量 相似 系数 的 绝对 值 
越 接近 于 1， 说 明 这 两 个 变量 的 关系 越 密切 ， 性 质 越 接近 。 相 似 系 数 绝对 值 大 的 变量 归 为 
-类 ， 相 似 系数 绝对 值 小 的 变量 归属 于 不 同 的 类 。 

第 i 个 变量 与 第 j 个 变量 之 间 的 相似 系数 记 为 C; ， 一 般 要 求 C; 满足 如 下 3 个 条 件 : 

(1) |]|Gy | 志 1， 对 于 一 切 i，j。 

(2) |Ci |=1， 对 于 一 切 i。 

(3) C5 = 二 Cj;， 对 于 一 切 i,j。 

下 面 介绍 聚 类 分 析 中 常用 的 相似 系数 计算 公式 。 

1) Pearson 相关 系数 


Di —z) rs 一 瑟 ) 
Cy = rs 一 (7 -8) 


bp (zg —F) Sy Cs 
1=1 t=1 
式 中 , 云 和 2 却 分 别 为 第 i 个 变量 和 第 j 个 变量 各 样品 的 均值 。 
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从 统计 角度 来 看 ， 两 个 变量 的 相关 系数 是 描述 两 个 变量 线性 关系 强 弱 的 一 个 很 有 用 的 
数字 特征 。 因 此 用 任意 两 个 变量 的 个 观测 值 对 其 相关 系数 的 估计 可 作为 两 个 变量 关联 性 
的 一 种 度量 。 

2) 夹 角 余 弦 

















Ci = cosb 二 (7-9) 








若 将 第 i 个 变量 的 n 个 观测 值 Czuvzzai ,zw)T 和 第 j 个 变量 的 个 观测 值 (zy， 
Zz， ,zw )! 看 成 n 维 空间 中 的 两 个 向 量 ,， 则 久 正 好 是 这 两 个 向 量 的 夹 角 。 若 夹 角 余 弦 越 
大 ， 则 夹 角 越 小 ， 则 两 个 变量 越 相似 。 不 难看 出 ， ei 
后 的 夹 角 余 弦 。 

由 前 述 的 分 类 统计 量 的 定义 可 以 看 出 ， 用 距 ? a 距离 越 
小 ， 意 味 着 样品 之 间 的 关联 性 越 大 ; pe 玻 程度 的 度量 值 时 ， 相 似 系数 的 
绝对 值 越 大 ， 意 味 着 指标 之 间 的 关联 性 越 大 可 采用 以 下 公式 变换 ， 吵 一 1 
一 CG 。 另 外 ， 需 要 说 明 的 是 ， 有 时 样品 Cm 它们 的 亲 政 程度 ， 


变量 之 间 也 可 以 用 距离 来 描述 它们 度 ， 使 用 时 只 要 把 计算 公 SN 式 做 相应 的 处 理 
即 可 。 

聚 类 分 析 时 到 底 选 择 哪 一 JR 是 一 的 问题 ， 例 如 ， 选 择 距 离 作 
为 分 类 统计 量 时 ， i pe 通过 比较 分 析 ， 
I 

je 
J 不 < 
阅读 | 


运用 聚 类 分 析 对 企业 信贷 风险 评估 与 预测 


信用 风险 是 导致 银行 资产 质量 下 降 的 主要 原因 ， 也 是 商业 银行 面临 的 严重 挑战 之 一 。 国 内 外 许多 学 
者 和 专家 对 提高 信用 风险 做 出 了 很 多 的 贡献 。 我 们 可 以 用 体现 企业 偿 债 能 力 、 经 营 效率 分 析 能 力 、 盈 利 
能 力 及 发 展 能 力 的 公司 财务 绩效 评价 指标 体系 中 的 主要 考核 指标 并 以 这 些 指 标 作为 基础 ， 对 企业 贷款 的 
信用 风险 进行 聚 类 分 析 。 从 企业 的 偿 债 能 力 、 经 营 效率 、 有 至 利 能 力 、 发 展 能 力 这 4 个 方面 来 考虑 企业 在 
商业 银行 的 贷款 质量 是 可 行 的 。 比 如 说 一 家 企业 的 偿 债 能 力 好 ， 经 营 效率 高 ， 副 利 能 力 好 ， 发展 能 力也 
好 ,那么 企业 的 前 景 不 错 ， 对 这 样 的 企业 进行 贷款 ， 它 的 贷款 质量 是 好 的 ， 至 少 是 正常 的 。 而 对 于 那 种 
偿 债 能 力 差 ， 经 营 效率 低 的 企业 相对 而 言 贷 款 质 量 就 要 差 些 。 所 以 对 企业 进行 贷款 的 商业 银行 可 以 通过 
企业 以 往 财务 指标 的 数据 进行 聚 类 分 析 ， 再 与 该 企业 实际 的 贷款 质量 进行 比较 分 析 ， 可 以 预测 与 该 企业 
财务 指标 类 似 的 企业 的 贷款 质量 ， 以 减少 其 信用 风险 。 运 用 聚 类 分 析 模 型 能 为 商业 银行 对 企业 贷款 质量 
做 出 评估 ， 具 有 一 定 的 参考 价值 ， 可 以 直接 从 企业 的 财务 指标 数据 来 估计 企业 的 违约 几率 ， 进 一 步 降 低 
商业 银行 的 贷款 风险 ， 提 高 银行 信贷 资产 质量 。 

资料 来 源 : 胡平 ， 崔 文田 、 徐 青川 . 应 用 统计 分 析 教 学 实践 案例 集 [M]. 北京 ,清华 大 学 出 版 
社 。2007. 
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7.3 系统 聚 类 法 


7.3.1 类 间距 离 


系统 聚 类 法 的 聚 类 效果 一 方面 取决 于 分 类 统计 量 的 选择 ， 另 一 方面 还 取决 于 类 间距 离 
的 定义 。 对 于 样品 (或 变量 ) 之 间 的 距离 ， 我 们 可 以 根据 问题 和 数据 的 实际 情况 ， 从 分 类 
统计 量 中 选取 最 适合 的 一 种 ; 而 对 于 类 与 类 之 间 的 距离 ， 主 要 是 解决 以 谁 来 代表 全 类 ， 可 
以 有 种 种 不 同 的 规定 代表 的 方法 ， 由 此 产生 出 种 种 不 同 的 类 间距 离 的 定义 及 聚 类 方法 。 系 
统 聚 类 分 析 方法 主要 有 最 短 距 离 法 、 最 长 距离 法 、 中 间距 离 法 、 重 心 法 、 类 平均 法 、 类 间 
平均 连接 法 、 类 内 平均 连接 法 和 离 差 平方 和 法 。 下 面 介 绍 几 种 常用 的 系统 聚 类 分 析 方 法 。 








考虑 类 Gn 与 类 G 之 间 的 距离 ， 并 假设 类 Gr 中 共 元 案 六 ( 样 品 或 统计 量 )， 类 
Gy 中 共有 "个 元 素 。 用 ,和 ,表示 两 个 类 的 重心 Ee 
1. 最 短 距 离 法 ch 
OY 


AN 
最 短 距离 法 是 (Nearest Neighbor) 定义 G5 类 G6， 中 两 个 最 近 元 素 之 间 的 距离 为 
这 两 类 之 间 的 最 短 距离 。 计 算 公式 为 ，“” 


DN(CP， DN ed, "REG,} (7-10) 
2 最 长 距离 法 Ro 站 
最 长 距离 法 是 (Furthest Phbon 定义 关 6 Se 中 两 个 最 远 元 素 之 间 的 距离 为 
这 两 类 之 间 的 最 长 距离 > 计算 公式 为 KR 
2 人 pr， Dm y Gp ,kE Gs)} (7-11) 


~ 
8 NS 二 
重心 法 (Centroid Clustering) 将 类 Gy 与 类 Gy 之 间 的 距离 定义 为 这 两 类 重心 之 间 的 
距离 。 计 算 公 式 为 
De (p,q) d(x, sz,) (7-12) 
f 此 
式 中 ,5 和 元 , 分 别 是 类 Gy 与 类 Gy 的 重心 , = i 4 = PD 


一 1 ji=1 





4. 类 平均 法 
类 平均 法 是 (Median Clustering) 定义 类 Gun 与 类 G 中 每 两 个 元 素 之 间距 离 的 平均 值 
为 这 两 个 类 之 间 的 距离 。 计 算 公 式 为 
Dw(p.0) = 产 也 Da (7-13) 


EGojEG 





5. 离 差 平方 和 法 

离 差 平方 和 法 (Ward's Method) 是 把 两 类 合并 增加 的 离 差 平方 和 当成 是 平方 距离 。 

设 G, 类 中 第 i 个 元 素 为 x; ,ni 为 G4 中 元 素 的 个 数 , 云 为 G1 类 的 重心 则 G, 类 中 元 
素 的 离 差 平 方 和 为 
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-Dr (7—14) 
于 是 , 类 Gy 与 类 G。 之 间 的 离 关 平 方 和 距离 为 
Dy(p,q) 王 |So+y 一 So 一 Sy| (7—15) 





式 中 ，Sp+4 表 示 G。 和 G 两 类 合并 后 的 类 GUG, 的 元 素 离 差 平方 和 。 


多国 中央 的 … 








系统 聚 类 法 的 综合 运用 
由 于 各 种 聚 类 法 所 采用 的 类 与 类 之 间 的 距离 的 定义 不 同 ， 产 生 不 同 的 聚 类 结果 是 很 自然 的 。 对 于 一 
个 具体 问题 ， 比 较 好 的 做 法 是 试探 各 种 聚 类 方法 ， 同 时 ， 对 于 一 个 给 定 的 聚 类 法 ， 采 用 几 种 不 同 的 样品 
间距 离 (或 变量 间 的 相似 系数 ) 进行 聚 类 ， A 


信 的 。 另 外 一 个 经 验 的 总 结 是 。 最 短 距离 法 适用 于 样品 散 点 图 (即将 每 个 成 mm 维 空间 中 的 点 所 形 
成 的 图 形 ) 是 条 形 图 ， 其 至 S 形 的 类 ， 他 广 站 和 人民 二。 由 于 SPSS 统计 分 析 软 件 中 
的 聚 类 分 析 功 能 所 支持 的 距离 包括 我 们 常用 的 几乎 所 有 的 距 ， 其 优势 在 于 每 一 种 距离 的 计算 聚 类 
过 程 可 以 在 瞬间 完成 ， 因 此 大 量 尝 Er 以 便 我 们 对 数据 做 出 更 加 迅速 


和 精确 的 结论 。 NNN 
7.3.2 系统 聚 类 分 析 NN 
系统 聚 类 分 析 mo Analysis) 是 中 应 用 最 广泛 的 一 种 方法 ， 


凡是 具有 数值 特征 的 变量 和 冬训 ee ， 选 择 不 同 的 分 类 统计 量 可 获 
得 不 同 的 分 类 效果 。 在 系统 聚 类 分 析 中 ， 无 法 类 别 数 。 系 统 聚 类 法 的 基本 思路 : 
首先 将 各 样品 《或 变量 ) 各 作为 一 类 ， 并 计算 商 两 之 间 的 分 类 统计 量 (距离 或 相似 系 
数 ); 其 次 按 类 间距 将 度量 准则 将 两 类 合 着 成 为 新 类 ， 并 计算 新 类 与 其 他 类 的 距离 ; 最 后 
再 按 类 间距 离 度量 准则 合并 类 。 这 样 每 次 缩小 一 类 。 直到 所 有 的 样品 (或 变量 ) 都 并 成 一 
类 为 止 。 这 个 并 类 过 程 可 以 用 i 谱系 聚 类 图 清楚 地 表达 出 来 。 

1. 系统 聚 类 分 析 的 算法 步骤 

下 面 以 Q 型 聚 类 分 析 为 例 ， 选 取 距 离 作为 分 类 统计 量 ， 聚 类 方法 选择 最 短 距 离 法 ， 则 
系统 聚 类 分 析 的 算法 步骤 如 下 : 

系统 聚 类 分 析 的 计算 基础 是 由 个 样品 构成 的 距离 矩阵 ， 即 








0 
回 共 帝国 dn 0 
二 了 D=|d da 0 
回 
村 和 dt 0 


第 一 步 : 

(1) 在 矩阵 DD 中 寻找 距离 最 小 的 di; 值 ， 记 为 di .; ， 合 并 第 i 类 和 第 坟 类 为 第 nn 十 1 类 。 

(2) 第 "十 1 类 与 其 他 各 类 的 距离 由 原来 的 第 i 类 和 第 ji 类 与 其 他 各 类 的 距离 决定 ， 
即 dsti.t=min(di .t» dj .#)。 


林 交 和 折 | 2 

(3) 得 到 新 类 后 ， 原 来 的 第 im 类 和 第 1 类 的 两 个 类 号 被 撤消 ， 即 在 距离 矩阵 中 划 去 
第 1 行 、 第 放行 、 第 1 列 、 第 1 列 ,增加 第 n 十 1 行 和 第 n 十 1 列 ， 得 到 新 的 距离 矩阵 
Di ， 它 与 矩阵 也 相 比 降 了 一 阶 。 

第 二 步 : 在 矩阵 Di 中 重复 第 一 步 的 工作 ， 并 记 心 .为 本 步 中 距离 最 小 的 值 ， 合 并 
第 类 和 第 js 类 为 第 w+2 类 。 距 离 矩 阵 的 更 新 与 第 一 步 类 似 值 得 注意 的 是 ,车 i = 
n 十 1 时 ,那么 合并 第 i 类 和 第 js 类 时 ， 实 际 是 把 最 初 的 第 五 、 广 类 与 第 js 类 3 个 样品 
合 为 一 类 ) 。 

第 三 步 ， 如 此 反复 进行 ， 直 到 得 出 的 距离 矩阵 是 2X2 阶 矩 阵 ， 最 后 把 所 有 个 样品 
都 聚 成 一 类 了 ， 则 聚 类 结束 。 

从 以 上 聚 类 过 程 可 以 看 出 ， 后 面 某 些 步骤 的 类 的 聚合 效果 都 要 比 前 面 聚 合 的 类 差 ， 因 
oi i 
水 平 上 得 到 若干 类 了 。 pa 

【 例 7.1] 有 有 个 可， 六 类 计量。 和 陡 4 为 

(1) (2) (3) (全 6) 


(1) /0 SSE 

















ac 





试 进行 肾 关 分 析 ， 2 
解 : 第 一 步 : ss RF, 合并 第 5、3 类 得 类 ， 计算 第 6 类 与 其 他 各 类 的 距离 : 
pe | dn =min(difa Nmin(s,2)=2 
| dsz =min{ di# dss} =min{6.5}=5 
‘ da =min{ds4 ,da)}=min{(5,8)=5 
更 新 距离 矩阵 ， 即 把 原 距离 矩阵 中 的 第 3、5 行 及 第 3、5 列 划 去 ,并 增加 第 6 行 和 第 6 


列 ， 得 新 距离 矩阵 为 
(1) (2) (4) (6) 


(1) (0 

(2)|7 0 

(4) |9 4 0 
(6)\2 5 5 0 


第 二 步 : ds1 一 2 最 小 ,合并 第 6、1 类 得 第 7 类 ; 计算 第 7 类 与 其 他 类 的 距离 
drz=min{ds2 ,di2}=min{5,7}=5,.dn =min{des ,di4}=min{5,9)=5 


得 新 距离 矩阵 为 
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第 三 步 ，dws 最 小 ， 合 并 第 4、2 类 得 第 8 类; 计算 第 8 类 与 其 他 类 的 距离 ， 
dsrz 一 min{diy ,dz7} 一 min{(5,5} 一 5 
得 新 距离 矩阵 为 ， 
(7) (8) 
(7) 10 
I , 
_ 第 四 步 : 合并 第 8、7 类 得 第 9 类 。 至此， 来 类 
5 完毕 。 上 述 聚 类 过 程 可 以 用 谱系 聚 类 图 直观 表示 ， 
如 图 7. 1 所 示 。 
2 如 以 距离 不 超过 3 为 聚 类 的 临界 水 平 ， 则 这 5 个 
I 样品 可 以 分 为 3 大 类 ， 即 第 3、1 号 样品 为 一 大 类 ， 
条 4 号 和 入 ?号 和 记 志 关 
NS 
辱 和 成 站 系统 聚 类 分 析 兴 应 内 
图 7.1 系统 聚 类 分 析 谱 系 聚 类 图 系统 聚 类 分 析 可 以 实现 对 一 批 样品 或 变量 按照 它 
们 在 性 质 上 效 某 施 、 相 似 程度 进行 分 类 。 对 样品 聚 类 ， 
可 以 将 具有 相同 特点 的 样本 聚集 在 一 起 ; , 邓 赛 量 聚 类 ， 可 以 使 得 具有 共同 特征 的 变量 作为 
-类 ， 根 据 分 类 结 选择 少数 几 个 具有 代 琳 从 的 变量 进行 其 他 统计 分 析 。 下 面 重点 介绍 变 
时 分 类 后 代表 性 变 其 的 选择 方法 >、\、 A 
用 系统 聚 类 法 分 类 完 之 后 W 计 四 每 类 中 相关 指数 的 平均 值 Rr， 取 其 中 较 大 者 对 应 的 
指数 作为 该 类 的 代表 性 变量 :一 、 、XL 
计算 公式 为 一 
i 人 


0 











加 > B= j= lk 
a 式 中 ，R 为 某 一 类 中 变量 的 个 数 ; 蕊 为 该 类 内 变量 X; 对 类 中 其 他 变量 的 相 
关系 数 的 平均 值 。 


【 例 7.2】 已 知 体重 、 胸 围 、 大 腿 围 是 一 类 的 3 个 指标 ， 其 相关 系数 如 表 7 一 1 所 示 。 
试 选 出 该 类 中 的 代表 性 指标 。 
表 7-1 体重 、 胸 围 、 大 腿 围 之 间 的 相关 系数 














体 重 胸 围 腰 围 
体重 | h 
胸围 0. 85 
腰围 | 0.76 | 0. 60 1 














解 : 计算 体重 对 胸围 及 腰围 的 相关 指数 的 平均 值 Ri : 
2 _ (0.85)2 十 (0.76)2 
Ri= 3 


计算 胸围 对 体重 及 腰围 的 相关 指数 的 平均 值 R2: 











0. 65 



































| 而 


天 = 人 0. 下 全 0 
计算 腰围 对 体重 及 胸围 的 相关 指数 的 平均 值 R3 : 


(0. 76)? + (0. 60)2 
=—1 


由 于 Ri 汪 > 及 R3， 所 以 选择 体重 作为 这 一 类 的 代表 性 指标 。 一 般 来 说 ， 在 身高 一 定 
的 前 提 下 ,体重 比较 重 的 人 其 胸围 及 腰围 的 指标 也 都 比较 大 些 ， 这 与 常规 相符 合 。 


网 名 国 回 几 鸭 


R:= 0.47 








有 序 样品 的 聚 类 
在 有 些 实际 问题 中 ， 要 研究 的 对 象 与 时 间 的 顺序 密切 相关 。 例 如 ， a 年 到 2016 年 ,国民 收入 
可 以 划分 为 几 个 阶段 。 阶 段 的 划分 必须 以 年 份 的 顺序 为 依据 ， ss 民 收 入 接近 的 年 份 划分 


段 看 作 一 类 ， 这 种 分 类 称 为 分 割 。 显 然 ， 分 点 在 不 同位 置 可 同 分 割 。 这 样 就 存在 一 个 如 何 决定 
分 点 ， 使 其 达到 所 谓 最 优 分 割 的 问题 。 即 要 求 一 i 部 样品 间 的 差异 最 小 ， 而 各 段 之 间 样 
品 的 差异 最 大 。 


SR 回 糙 当 回 
镀 阅读 专栏 7-2 RN : 
,水 和 扫 类 分 析 的 主 ~ 【期 刊 推荐 】 
本 类 分 析 是 研究 于 从 类 网 对 本 方法 广泛 地 用 站 和 学 、 社 会 科学 、 工 农业 生产 的 名 个 领域， 
在 商业 上 : 取 类 人 VR 罗 且 发现 不 同 的 守 记 本 卉 通过 购买 模式 刻画 不 同 客户 群 的 特征 。 聚 类 分 
所 是 分 市 世 约 疏失 本 时 也 可 用 于 研 史 芒 和 于 行为， 所 找 新 的 浴 在 市 场 。 并 作为 元 从 析 的 预 
处 理 。 / 
在 生物 上 ， 聚 类 分 析 被 用 来 对 动 植物 进行 分 类 和 对 基因 进行 分 类 ， 获 取 对 种 群 固有 结构 的 认识 。 
在 地 理 上 ， 聚 类 分 析 可 以 从 地 球 观测 数据 库 中 帮助 识别 具有 相似 的 土地 使 用 情况 的 区 域 。 
在 保险 行业 上 ， 聚 类 分 析 通 过 一 个 高 的 平均 消费 来 鉴定 汽车 保险 单 持 有 者 的 分 组 ， 同 时 根据 住宅 类 
型 、 价 值 、 地 理 位 置 来 鉴定 一 个 城市 的 房产 分 组 。 
在 因特网 应 用 上 聚 类 分 析 被 用 来 在 网 上 进行 文档 归 类 ， 以 修复 信息 。 
在 电子 商务 上 : 聚 类 分 析 在 电子 商务 网 站 建设 及 数据 挖掘 中 也 有 很 重要 的 应 用 .通过 分 组 聚 类 出 具 
有 相似 浏览 行为 的 客户 ， 并 分 析 客 户 的 共同 特征 ,可 以 更 好 地 帮助 电子 商务 的 用 户 了 解 自 己 的 客户 ， 疝 
客户 提供 更 合适 的 服务 。 


7.4.1 聚 类 分 析 SPSS 操作 过 程 


(1) 选择 “Analyze 一 Classify 一 Hierarchical Cluster” 选 项 ， 弹 出 “Hierarchical 
Cluster Analysis” 对 话 框 。 


到 一 个 段 内 。 对 于 这 类 有 序 样品 的 分 类 ， 关中 下 削 要 我 由 二 a “pe 每 个 分 
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(2) 选择 参与 聚 类 分 析 的 变量 到 “Variable(s)” 框 中 。 

(3) Label Cases by 列表 框 : 输入 标签 变量 ， 该 变量 的 取 值 将 在 分 析 结 果 中 取代 样品 
号 出 现 。 该 列表 框 只 在 样品 聚 类 时 使 用 。 

(4) Cluster 项 : 选择 聚 类 类 型 ， 包 含 2 个 单 选 按钮 。 

@ Cases 单 选 按钮 : 对 样品 进行 聚 类 ， 即 Q 型 聚 类 ， 是 系统 默认 的 方式 。 

@ Variables 单 选 按钮 : 对 变量 进行 聚 类 ， 即 R 型 聚 类 。 

(5) Display 项 : 选择 输出 结果 的 方式 。 包 含 2 个 复 选 框 。 

g@ Statistics 复 选 框 : 输出 统计 量 。 

@ Plots 复 选 框 : 输出 统计 图 。 

(6) 单 击 “Statistics” 按 钮 ， 弹 出 “Hierarchical Cluster Analysis: Statistics” 对 话 框 。 

@@ Agglomeration schedule 复 选 框 : 选择 输出 Wd 显示 聚 类 过 程 
中 每 一 步 合并 的 类 ， 根 据 该 表 跟踪 聚 类 的 合并 过 程 。 Se 

加 Proximity matrix 复 选 框 : 选择 输出 样品 或 变量 上 或 相似 系数 和 矩阵。 

@ Cluster Membership 项 : 选择 输出 样品 或 变 的 所 属 类 别 ， 包含 3 个 单 选 按钮 。 

a，None 单 选 按钮 , 不 输出 样品 或 变量 的 所 属 类 别 ， 是 系统 默认 的 方式 。 

b，Single solution 单 选 按钮 : 在 -Nombacofatsterw 文本 框 中 输入 数值 &， 输 出 划 
分 为 类 时 样品 或 变量 所 属 类 别 的 结果 

c. Range of solutions 单 先 按 乌 。 站 Htinimam number of clusters:” 文 本 框 中 输入 
数值 m， 在 “Maximum number apeldsters:” 文本 框 中 输 尖 数值 n， 输 出 划分 为 m 至 nn 类 
时 样品 或 变量 所 属 类 别 的 结果 -0 人 

@ 单 击 “ContinueX 按 乌 ， 返回 到 i Analysis” 对 话 框 。 

(7) 单 击 “PlotgY 按钮 ， 弹 出 “Hier: Ichieal Cluster Analysis: Plots” 对 话 框 。 

@ Dendrogyanmi 复 选 框 :选择 输出 聚 给 结果 的 树 状 图 。 

四 aie 六壬 欠 出 到 类 结果 的 亲人 ， 包 含 3 个 单 选 按 钮 。 

a， All clusters 单 选 按钮 : 输出 聚 类 全 过 程 的 冰 柱 图 。 

b，Specified range of clusters 单 选 按钮 : 输出 某 个 阶段 的 冰 柱 图 。 在 “Start cluster:” 
文本 框 中 输入 起 始 类 别 数 值 ; 在 “Stop cluster:” 文 本 框 中 输入 终止 类 别 数值 ; 在 “By:” 
文本 框 中 输入 步 长 。 

c， None 单 选 按钮 : 不 输出 冰 柱 图 。 

加 Orientation 项 : 选择 冰 柱 图 ,包含 2 个 单 选 按钮 。 

a，Vertical 单 选 按钮 ， 输出 纵向 冰 柱 图 。 

b. Horizontal 单 选 按钮 : 输出 横向 冰 柱 图 。 

@ 单 击 “Continue” 按 钮 ， 返 回 到 “Hierarchical Cluster Analysis” 对 话 框 。 

(8) 单 击 “Method” 按 钮 ， 弹 出 “Hierarchical Cluster Analysis: Method” 对 话 框 。 

@ Cluster Method: 下 拉 列 表 框 :选择 系统 聚 类 方法 .系统 提供 7 种 方法 。 

a，Between 一 groups linkage: 类 间 平 均 连接 法 ， 是 系统 默认 的 方法 。 合 并 两 类 的 结果 
使 所 有 的 两 两 样品 或 变量 之 间 的 平均 距离 最 小 ， 两 个 样品 或 变量 分 别 届 于 不 同 的 类 。 

b，Within -~ groups linkage: 类 内 平均 连接 法 。 合 并 后 的 类 中 的 所 有 样品 或 变量 之 间 
的 平均 距离 最 小 ， 两 类 间 的 距离 是 合并 后 的 类 中 所 有 可 能 的 样品 或 变量 之 间 的 距离 平方 。 














第 7 章 
聚 类 分 析 
c。，Nearest neighbor: 最 短 距离 法 。 用 两 类 间 最 近 点 的 距离 代表 两 类 间 的 距离 。 
d.， Furthest neighbor: 最 长 距离 法 。 用 两 类 间 最 远 点 的 距离 代表 两 类 间 的 距离 。 
e. Centroid clustering: 重心 法 。 以 两 类 重心 (均值 ) 之 间 的 距离 代表 两 类 间 的 距离 。 
f Median clustering: 中 间距 离 法 。 以 最 短 距离 与 最 长 距离 的 中 间距 离 代表 两 类 间 的 
距离 。 
g. Ward's method: 离 差 平方 和 法 。 根 据 方差 分 析 的 原理 得 到 ， 若 分 类 较为 合理 ， 则 
同类 之 间 离 差 平 方 和 较 小 ， 类 与 类 之 间 的 离 差 平方 和 较 大 。 
@ Measure 单 选 框 : 选择 进行 聚 类 分 析 的 数据 类 型 ， 包 含 3 个 单 选 按钮 。 
a Interval 单 选 按钮 : 用 于 连续 变量 。 在 下 拉 列 表 框 中 系统 提供 了 8 种 测算 距离 的 
图 法 ; 


























@ Euclidean distance: 欧 氏 距离 。 x 
@ Squared Euclidean distance: 欧 氏 距离 的 平方 。 扔 
@ Cosine: 夹 角 余弦 。 < 


@ Pearson correlation: 皮尔 逊 相关 系数 。 2 

@ Chebychev: 切 比 雪 夫 距 离 。 即 最 大 绝对 1 离 ， 

e Block 绝对 值 距离 和 。 we 

@ Minkowski: 明 可 夫 斯 基 距 离 。 人 

@ Customized: 自 定义 距离 。 A 

b，Counts 音 选 按钮 :用 于 计 笋 问 明 ， >» 

c，Binary 单 选 按钮 : 用 璐 工 值 亚 量 。 v A WX 

图 Transform Valu :项 ， 选择 数据 标准 化 2 换 处 理 - 

在 Standardize; 下 拉 列 表 框 中 ， wj 数据 标准 化 变换 的 方法 。 

® None: 不 做 变换 。 是 系统 默认 的 

。 ZScokes,) 使 各 变量 的 均值 为 0， 标 =: 关 为 1， 是 常见 的 数据 标准 化 方法 ， 

@ Range -1 to 1: 使 各 变量 值 在 一 1 到 1 之 间 变 化 ， 即 对 每 个 值 用 正在 被 标准 化 的 变 
量 值 的 范围 去 除 。 

@ Range 0 to 1: 使 各 变量 值 在 0 到 1 之 间 变化 ， 即 对 正在 被 标准 化 变量 的 值 减 去 正在 
被 标准 化 变量 的 最 小 值 ， 然 后 除 以 范围 。 

@ Maximum magnitude of 1: 使 各 变量 值 最 大 值 为 1， 即 对 正在 标准 化 变量 的 值 用 最 
大 值 去 除 。 

@ Mean of 1: 使 各 变量 值 平均 值 为 1， 即 将 数值 标准 化 到 一 个 均值 的 范围 ， 对 正在 被 
标准 化 变量 的 值 除 以 正在 被 标准 化 变量 的 值 的 均值 。 

@ Standard deviation of 1: 使 各 变量 值 标准 差 为 1， 即 将 数值 标准 化 到 标准 差 为 1， 对 
每 个 值 除 以 正在 被 标准 化 变量 的 标准 差 。 

四 Transform Measures 选项 组 : 选择 距离 测量 结果 的 转换 方法 . 包含 3 个 复 选项 。 

a， Absolute values 复 选 框 : 将 距离 取 绝对 值 ， 当 数值 符号 表示 相关 方向 ， 且 只 关心 
数值 大 小 时 使 用 本 方法 。 

b. Change sign 复 选 框 : 将 相似 性 变 为 不 相似 性 或 相反 ,用 取 反 的 方法 使 距离 顺序 颠 
倒 过 来 。 
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c，Rescale to 0- 1 range: 使 距离 取 值 于 0 一 1 间 ， 首先 减 去 最 小 值 ， 然 后 除 以 范围 ， 
使 距离 标准 化 。 

回 单 击 “Continue” 按 钮 返回 到 “Hierarchical Cluster Analysis” 对 话 框 。 

(9) 单 击 “Save” 按 钮 ， 弹 出 “Hierarchical Cluster Analysis: Save New Variables” 
对 话 框 。 该 选项 只 在 进行 样品 聚 类 时 可 用 ， 用 于 按 要 求生 成 新 变量 以 存储 聚 类 结果 ， 这 些 
变量 将 存 人 数据 文件 中 。 在 Cluster Membership 选项 组 中 ， 包 含 3 个 单 选 按钮 。 

@ None 单 选 按钮 : 不 建立 新 变量 。 

© Single solution 单 选 按钮 : 生成 一 个 新 变量 ， 标 明 每 个 样品 最 后 所 属 的 类 ， 在 该 项 
后 面 的 编辑 框 中 指定 类 数 。 

加 Range of solutions 单 选 按钮 : 指定 范围 内 的 结果 ， 生 成 若干 个 新 变量 ， 标 明 聚 为 
若干 个 类 时 ， 每 个 样品 最 后 所 属 的 类 。 

@ 单 击 “Continue” 按 钮 ， 返 回 到 “Hierarchical Clus > 对 话 框 。 
(10) 单 击 “OK” 按 钮 ， 输 出 聚 类 分 析 结 











网 内 国 中介 





op de pra 主要 的 障碍 是 对 分 类 的 结构 和 


内 容 很 难 给 出 一 个 统一 的 定义 。 实 际 应 人 从 实用 的 角度 出 发 选择 合适 的 
分 类 数 。 SS 分 类 的 准则 。 wi 

准则 1: 任何 类 必须 在 邻近 谷类 对 是 突出 的 ， 有 各 类 台风 向 须 大 。 

准则 2， 各 类 所 包含 的 欧 生 不 应 过 多 。 Ng 

准则 3， 分 类 的 数 包 了 该 将 合 使 用 的 目的 。 


准则 4， 车 用 几 闻 不 辣 的 取 类 方法 处 理 , 讽 大 各 自 的 聚 类 图 上 应 发 现 相同 的 类 。 














舍 阅读 专栏 7-3 


聚 类 分 析 在 SPSS 操作 中 的 注意 事项 


从 SPSS 实际 操作 来 讲 ， 聚 类 分 析 法 有 多 种 方法 。K 一 means cluster analysis、Two step cluster analy- 
sis、Hierarchical cluster analysis 三 种 聚 类 方法 在 SPSS 里 都 有 提供 ,但 其 应 用 范围 和 优 劣 势 各 有 不 同 。 

K -means cluster analysis (KCA) 也 称 为 快速 聚 类 ， 是 我 们 现在 做 人 群 细 分 时 最 常用 的 方法 。 该 方 
法 是 单纯 应 用 统计 技术 根据 若干 指定 变量 (应 限制 为 尺度 变量 ) 将 众多 案例 分 到 固定 的 类 别 中 去 。 此 种 
方法 用 于 大 量 〈 数 千 ) case 的 类 别 划 分 时 非常 有 效 。 但 该 方法 可 以 选择 的 内 容 较 少 ， 最 重要 的 是 选择 聚 
类 的 数量 、 迭 代 的 次 数 和 聚 类 的 中 心 位 置 。 人 为 经 验 和 判断 无 形 中 会 起 很 大 作用 。KCA 方法 本 身 是 要 求 
事先 确定 分 类 的 。 它 不 仅 要 求 确定 分 类 的 类 数 . 而且 你 还 需要 事先 确定 点 ， 也 就 是 聚 类 和 种子。 当然， 
SPSS 可 以 为 你 自动 选 种 子 。 接 着 ， 根 据 其 他 点 离 这 些 种 子 的 远近 把 所 有 点 进行 分 类 。 然 后 ， 就 是 将 这 几 
类 的 中 心 (均值 ) 作为 新 的 基石 ， 再 分 类 。 如 此 迭代 。 因 此 ,前 面 聚 类 基石 或 者 说 种 子 的 选择 不 儿 过 于 
认真 。 

Two step cluster analysis 是 揭示 自然 类 别 的 探索 性 工具 。 该 方法 的 算法 与 传统 聚 类 技术 相 比 有 一 些 
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显著 的 特点 ; 它 可 以 基于 类 别 变量 和 连续 变量 来 进行 聚 类 ; 自动 选择 聚 类 结果 的 最 佳 类 别 数 ; 具备 有 效 
分 析 大 量 数据 的 能 力 。 

如 果 我 们 只 拥有 少量 的 case ( 少 于 数 百 个 )， 并 且 想 尝试 多 种 聚 类 方法 ,测量 不 同类 别 之 间 的 差异 ， 
我 们 就 应 该 尝试 使 用 Hierarchical cluster analysis (HCA)。 当 然 该 方法 不 仅 可 以 对 样本 聚 类 ， 也 可 以 对 
变量 聚 类 。 此 种 方法 的 分 类 结果 取决 于 对 聚 类 方法 、 距 离 测量 方法 、 标 准 化 变量 的 设置 。 这 种 方法 不 事 
先 确定 类 数 ， 有 多 少 点 就 是 多 少 类 ， 它 沿 着 最 近 的 先 聚 为 一 类 的 行 合并 ， 直 至 最 后 只 有 一 大 类 
为 止 。 


7.4.2 聚 类 分 析 SPSS 输出 结果 解释 





oe 
【 例 7.3】 对 导入 案例 7 - 1 进行 聚 类 分 析 。 表 7 - 2 给 出 了 2014 年 我 国 汉人 
31 个 省 、 自 治 区 、 直 辖 市 的 土地 利用 情况 单位， 万 公 硕 )， 依 据 给 出 的 数 。 加 并 


据 对 全 国 各 省 市 进行 分 类 。 从 【拓展 视频 】 
表 7- 2 2014 年 31 个 省 市 自治 区 土地 利用 情况 

































































地 区 园 地 牧草 地 交通 用 地 水 利 设施 用 地 
北京 13.6 0.02 . 人 和 | 
天 津 3 0 RA 2 6 
河北 84.5 1 do 和 人 > 17.4 10.6 

上 一 二 
山西 40.9 $3.4 9.6 3.7 
内 蒙古 S57 T4958.9 20 6.7 
放学 F 7 0.3 14.7 13.8 
吉林 人 6.6 23,8 8.7 13.5 
黑龙 江 4.5 109.9 120. 9 15 24.1 
上 海 3 0. 0003 27 2.9 0.3 
江苏 30.6 0.01 185.2 20.7 16.6 
浙江 59.8 0.03 96.7 13.5 13.9 
安徽 35.3 0.1 161 la 20.7 
福建 78.2 0.03 60.9 10.7 Ci 
江西 32.9 0.1 92. 4 9.6 20.2 
山东 72.8 0.6 站 2 20.4 23.1 
河南 22:8 0.03 216.4 16.9 18.6 
湖北 48.8 0.2 125.8 10.9 26.4 
湖南 67.2 1.4 129.8 13.2 15.2 
广东 128.9 0.3 157.3 16.5 19.4 
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( 续 ) 
地 区 园 地 牧草 地 Be 交通 用 地 水 利 设施 用 地 
广西 108.9 0.5 87.4 12.8 I 
海南 92.8 1.4 25:4 如 没 SF 
重庆 大 4.6 54.4 5.7 3.8 
四 川 74 1096. 1 150 13.7 mls 
贵州 16.8 的 这 5l1 8.2 4 
云南 164.3 14.8 81.2 10,8 7.9 
西藏 0.2 7069.8 9.6 pi 把 0.6 
陕西 82.6 218.2 77.6 NN ‘9.6 3.6 
甘肃 25.9 592.3 75.7 A 7.5 3.8 
青海 0.6 4081.5 3 二 4.5 6.2 
宁夏 5.2 150.1 ， 并 25.7 3.4 0.9 
新 疆 62.7 3575. KE 中 113 13.6 23.5 
资料 来 源 ; 《2015 中 国 统计 年 鉴 )》Q AN， wk 


1 Xo 
解 : 采用 系统 到 类 分 析 宙 的.Q 并 到 类 方法 对 31 次 省 和、 自治区、 直辖 市 进行 分 类 。 系 
统 聚 类 方法 选择 类 问 平均 连接 法 Cr 输出 聚 类 分 析 结 果 如 下 ， 
(1) 输出 样品 的 距离 阵 如 表 7-3 所 未 。、 


WA 3 
SN A 表 7-3 数据 信息 [Case Processing Summary', ) 
1 Cases 


Valid Missing Total 











N Percent N Percent N Percent 





31 100.0 0 -0 3 100.0 




















a Squared Euclidean Distance used 





b. Average Linkage (Between Groups) 


表 7-3 表 明了 5 个 分 析 指 标的 记录 数据 统计 结果 。 共 31 个 有 效 样品 (Valid) 参加 了 
分 析 ， 无 缺失 值 记 录 (Missing)， 总 记录 数 为 31 个 (Total)。 表 下 方 的 “a Squared Eu- 
clidean Distance used” 表 示 采 用 欧 氏 距离 的 平方 作为 样品 距离 测量 方法 ，“b. Average 
Linkage (Between Groups)” 表 示 采 用 类 间 平 均 连接 法 作为 聚 类 分 析 方 法 。 

表 7-4 给 出 了 样品 的 距离 矩阵 ， 由 于 数据 量 较 大 ， 只 给 出 了 部 分 省 份 的 距离 矩阵 结 
果 。 每 一 个 省 份 的 土地 利用 情况 为 一 个 记录 或 一 个 样品 ， 不 同 省 份 的 土地 利用 结构 越 相 
近 ， 计 算得 到 的 距离 越 小 。 表 下 方 的 “This is a dissimilarity matrix” 表 示 这 是 一 个 不 相 
似 性 系数 符 阵 ， 即 数值 越 大 ,两 个 省 份 越 不 相似 。 
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聚 类 分 析 
表 7-4 样品 距离 矩阵 (Proximity Matrix) 
Squared Euclidean Distance 

1: 北京 | 2: 天 津 | 3: 河北 | 4: 山西 |5: 内 蒙古 | 6: 辽宁 | 7: 吉林 |8: 黑龙 江 
1: 北京 0 128.61 | 30731. 67 | 4015. 124 | 24601017 | 11632. 91 | 3799. 698 | 21024.3 
2: 天 津 | 128.61 0 31584. 13 | 4446. 63 | 24600680 | 11922.59 | 3449.4 | 20399.55 
3: 河北 | 30731. 67 | 31584. 13 0 12896.78 | 24201720 | 5835.9 | 16285. 25 | 15464. 42 
4: 山西 4015. 124 | 4446. 63 | 12896.78 0 24560281 | 2156. 32 1692. 39 | 14275. 34 
5: 内 蒙古 | 24601017 | 24600680 | 24201720 | 24560281 0 24589507 | 24357484 | 23513230 
6: 辽宁 | 11632.91 | 11922.59 | 5835.9 | 2156.32 | 24589507 0 4363.03 | 14041. 26 
7: 吉林 | 3799.698 | 3449.4 | 16285.25 | 1692.39 | 24357484 | 4363703 0 8851. 31 

8: 黑龙 江 | 21024.3 | 20399. 55 | 15464. 42 | 14275. 34 | 23513230 Zs 8851. 31 0 
9: 上 海 | 154.55 56.98 | 33571.01 | 5180. 688 | 2460 sor 4173. 926 | 21615. 84 
10: 江苏 | 24861. 51 | 24530. 74 | 4576. 024 | 10089. 76 | 2 S27 | 3221. 384 | 11315. 58 | 16980. 25 
11; 浙江 | 6815.33 | 7538.481 | 9949. 153 | 585. AN 1582 | 1359. 973 | 3553. 013 | 15821, 44 
12: 安徽 | 18041.92 | 17892.71 | 4708.34 | 6 Ad 24591729 | 1072.98 | 7214.03 | 14629.54 
13: 福建 | 5203.05 | 6528. 841 | 16970. O86N227 | 24600635 | 5984. 333 | 6322. 173 | 21410.6 
14: 江西 | 4622.356 | 4751.65 | 1 RN 378.5 | 24592210 | 1781.86 | 1352.37 | 13719. 22 
15: 山东 | 45369. 66 ee 22863. 66 | 24599 1102. 12 | 26994. 57 | 29185. 54 
16: 河南 | 35243. 32 | 34570. 23 .16578. 763 | 17428. 78 1 7885. 003 | 18144. 44 | 21542. 37 
17: 湖北 | 11047. 34 |,113 6608. 35 2110.88 | 24591060 | 206.35 | 4165.54 | 14042. 69 
18: 湖南 13086 30 [3799. 15 4832. 46 | 24580708 | 411.68 | 6195.35 | 15865.2 
19: 广东 区 到 31815. 19 | 4384.02 | ioi7. 96 | 24603763 | 7401. 84 | 20818. 03 | 28836. 82 
20: 广西 | 12707. 41 | 14489. 84 | 11662. 85 | 4844. 65 | 24598450 | 5766.91 | 11049. 64 | 24033. 25 
21: 海南 | 6311.544 | 8118.25 | 27149.96 | 6538. 62 | 24595862 | 13547. 56 | 11611. 33 | 29210. 9 
22: 重庆 | 805.566 | 1097.66 | 21640.91 | 1254.11 | 24551616 | 6509.11 | 1838. 58 | 16524. 21 
23: 四 川 | 1219607 | 1220437 | 1116021 | 1199155 | 14926313 | 1201859 | 1158613 | 978438.2 
24: 贵州 | 532.848 | 621.63 | 23569.38 | 1872.56 | 24524980 | 7537. 42 | 1622.79 | 16000. 34 
25: 云南 | 25624.2 | 28672. 94 | 17726. 23 | 15407. 01 | 24471844 | 16510. 27 | 24999. 42 | 36440. 67 
26: 西藏 | 49982391 | 49982627 | 49451822 | 49941671 | 4470949 | 49995138 | 49652050 | 48453296 
27: 陕西 | 54662. 97 | 56031. 91 | 43168.1 | 47962. 58 | 22483109 | 51754.4 | 43722. 43 | 20152.8 
28: 甘肃 | 352993. 3 | 353183. 8 | 320228.7 | 347169. 5 | 19070882 | 354223.7 | 323760. 3 | 235733.7 
29: 青海 | 16658717 | 16658742 | 16364572 | 16636626 | 781739.7 | 16670246 | 16468893 | 15783637 
30: 宁夏 | 22615. 41 | 22600. 94 | 43820. 31 | 26574. 87 | 23135934 | 35641. 11 | 19668. 86 | 11352. 37 
31: 新 疆 | 12791046 | 12791834 | 12500565 | 12758611 | 1918795 | 12779869 | 12615781 | 12011063 





























This is a dissimilarity matrix 
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(2) 输出 凝聚 过 程 表 如 表 7- 5 所 示 。 
表 7-5 凝聚 过 程 表 (Agglomeration Schedule) 








































































































Stage Cluster First 
Cluster Combined 
Stage Coefficients Appears Next Stage 
Cluster 1 Cluster 2 Cluster 1 Cluster 2 
1 » 9 56. 98 0 0 和 
2 22 24 132. 63 0 0 9 
3 2 141. 58 0 9 
4 6 17 206. 35 0 0 6 
5 4 14 378.5 0 0 8 
6 6 18 149. 205 4 r 0 11 
7 10 12 688. 548 0 险 0 12 
8 4 11 691. 416 5LA4 0 11 
9 和 22 900. 641 NA | 2 13 
10 13 21 1556.607 | 入 0 14 
11 4 6 1822. 997 SF 8 6 17 
12 10 16 2160A3X 个 ”7 0 16 
13 7 .2976. 87 9 0 18 
14 13 20 Wt 2 10_ 0 17 
15 3 15 SK Wizso. 48 人 0 16 
16 3 WY, | 00.738 -一 12 23 
17 4 把 6119. 909 WW 14 18 
18 让 | 7309. 37: 的 17 22 
19 19 ss 7425KSL 0 0 22 
20 Xe 30 1 0 0 21 
21 3 27 16760. 26 20 0 24 
22 1 19 17103. 44 18 19 23 
23 1 3 18965. 29 22 16 24 
24 1 8 36133. 03 23 21 27 
25 23 28 261829. 8 0 0 27 
26 29 31 268779.5 0 0 28 
27 23 748038. 6 24 25 30 
28 5 29 1350267 0 26 29 
29 5 26 8543083 28 0 30 
30 ll 5 25248934 27 29 0 

















表 7-5 给 出 了 反映 聚 类 过 程 的 凝聚 过 程 表 。 第 一 列 〈Stage) 为 聚 类 的 步骤 ;第 二 、 三 


列 (Cluster Combined) 表示 本 步骤 哪 两 类 合并 ,合并 结果 取 小 的 序号 ; 第 








中 








列 (Coeffi- 


cients) 表示 距离 系数 ; 第 五 、 六 列 (Stage Cluster First Appears) 表示 合并 的 结果 前 一 次 出 
现 的 聚 类 步 序 号 ; 第 七 列 (Next Stage) 表示 该 步 合并 结果 在 下 一 步 合 并 时 的 步 序 号 。 

如 在 第 1 步 (Stage 1) 中 , 样品 2 和 样品 9 合并 为 一 类 ,合并 结果 取 小 的 样品 序号 2; 
其 距离 系数 为 56. 98; 合并 的 两 项 都 是 首次 出 现 ， 所 以 Stage Cluster First Appears 栏 都 取 0; 


7 章 
机关 | ?9 

该 步 合并 结果 将 在 第 3 步 再 次 出 现 。 在 第 2 步 (Stage 2) 中 , 样品 22 和 第 24 类 (以 第 一 类 

中 较 小 的 样品 序号 为 标记 ) 又 合并 成 一 类 ,合并 结果 取 小 的 样品 序号 22; 其 距离 系数 为 

132. 63; 样品 22 和 24 都 是 首次 出 现 ， 所 以 Stage Cluster First Appears 栏 都 取 0; 该 步 合并 结 

果 将 在 第 9 步 再 次 出 现 。 经 过 30 步 聚 类 过 程 ，31 个 样品 最 后 合并 成 一 大 类 ， 聚 类 过 程 结束 。 

(3) 输出 分 类 结果 ， 如 表 7-6 所 示 。 
表 7-6 分 类 结果 的 类 成 员 表 (Cluster Membership) 


Case 7 Clusters 6 Clusters 5 Clusters 4 Clusters 
1: 北京 1 
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1 

| 1 
1 1 
2 z 外 和 2 
1 = 1 
L 
1 1 
1 1 
1 1 


1 
. 
2 
6: 辽宁 1 
. 
1 
1 
1 





















表 7 -6 给 出 了 划分 4 一 7 类 时 每 一 个 于 某 一 类 别 的 结果 。 当 聚 成 4 类 或 5 类 时 ， 
内 蒙古 属于 第 2 类 ; 同样 当 聚 成 6 类 或 类 时 ， 内 蒙古 属于 第 2 类 ,。 
(4) 输出 分 类 结 mag > 如 图 7.2 所 示 。 2 


Number of clusters 








图 7.2 分 类 结果 的 垂直 冰 柱 图 (Vertical Icicle) 
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图 7.2 给 出 了 部 分 样品 的 纵向 显示 的 冰 柱 图 ， 纵 坐标 “Number of Clusters) 表示 分 
成 的 类 数 。 在 第 1 步 分 类 时 ， 所 有 31 个 省 自治 区 、 直 辖 市 都 归 为 1 类 ,在 第 2 步 分 类 时 ， 
连 在 一 起 的 西藏 、 新 疆 、 青 海 、 内 蒙古 、 甘 肃 、 四 川 和 陕西 7 个 省 份 归 为 一 类 ， 其 他 省 份 
归 为 一 类 。 其 他 分 类 情况 依 此 类 推 。 

(5) 输出 谱系 聚 类 图 ， 如 图 7. 3 所 示 。 


Dendrogram using Average Linkage(Between Groups) 
Ressaled Distance Cluster Combine 


河北 


黑龙 江 


内 蒙古 





图 7.3 聚 类 分 析 树 状 图 


图 7.3 给 出 了 聚 类 分 析 树 状 图 直观 地 显示 了 样品 逐步 合并 的 过 程 。 如 何 得 出 最 后 分 
类 结果 由 用 户 自 己 决定 ， 取 决 于 用 户 选择 怎样 的 分 类 标准 ， 划 分 成 多 少 类 。31 个 省 市 自 
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治 区 、 直 辖 市 分 成 4 类 时 的 分 类 结果 如 下 : 

第 1 类 : 天津， 上 海 , 北京 ， 重庆 ， 贵州 ， 吉 林 ， 辽 宁 ， 湖北， 湖南， 山西 ， 浙江， 
福建 ,海南 ， 广西 ， 广东 ， 云南， 江苏， 安徽, 河南， 河北， 山东 ， 黑龙江， 宁夏 ， 陕 
西 ， 四 川 ， 甘 肃 。 
第 2 类: 青海， 新疆。 

第 3 类， 内 蒙古 。 
第 4 类 : 西藏 。 
我 们 可 以 对 比 其 他 分 类 结果 ， 从 而 选择 一 种 合适 的 分 类 划分 。 











LA | 
, "KS 
基于 聚 类 分 析 方法 的 职位 族 <R 

作为 分 类 于 工 灿 。 分 术 地 法 放 广 闫 尖 朋 于 汪 多 并 全权 和 拉线 
果 。 近 几 年 兴起 的 对 员工 职业 生涯 发 展 的 关注 ,, 当 求 企业 依据 各 职位 的 职业 发 展 水 平 对 其 
采取 针对 性 管理 ; 同时， 职位 分 族 管理 也 在 成 为 立 儿 趋势。 人 力 资源 管理 部 门 依据 不 同 职 
位 的 特征 进行 分 类 ， 构 成 多 个 “职位 族 "5\ 在 此 基础 上 进行 人 力 资源 管理 。 

职位 族 管理 是 基于 不 同 职位 所 要 区 的 职业 发 展 水 平 ， 故 所 选用 的 聚 类 变量 要 对 它 有 很 
好 的 表征 。 我 们 将 具体 职位 要 求 的 兴 职 位 权力 和 责任 、 严 痕 复杂 性 和 难度 、 救 育 与 专业 经 
验 、 知 识 与 技能 、 职 位 肩 出 席 忆 可 芍 代 性 和 组 织 环境 邹 识 度 ” 等 7 类 指标 作为 聚 关 因素 
来 表征 各 个 职位 的 职业 发展 水 平 。 下 面 对 这 些 因素 的 内 涵 作 一 些 界定 。 

(职位 权力 和 策 任 } 根据 权 责 对 等 的 原则 职位 权力 的 影响 范围 和 影响 强度 可 以 表 
征 这 个 因素 ,根据 权 为 的 性 质 分 为 执行 枢 或 建议 权 ， 调配 人 力 、 物 力 的 权限 等 。 

(2) 工作 发 案 竹 和 难度 ， 人际 交往 中 的 沟通 协调 能 力 、 科 研 攻关 中 解决 问题 的 能 力 。 

(3) 教育 与 专业 经 验 ， 学 历 与 行业 或 者 专业 从 业 年 限 是 外 显 的 指标 ， 注 意 这 两 者 的 结 
合 ， 理 论 知识 在 实践 中 得 到 应 用 ， 来 解决 实际 问题 。 

(4) 知识 与 技能 :体现 了 管理 、 技 术 、 技 能 等 不 同 职位 发 展 通道 上 职位 的 并 重 。 

(5) 职位 扇 出 度 : 主要 用 来 描述 职位 关系 ,职位 作为 组 织 中 的 一 个 基本 单元 ， 虽 然 每 
个 职位 都 具有 自己 相对 独立 的 功能 ， 但 这 个 功能 的 实现 要 靠 与 其 他 职位 的 协作 或 者 下 属 职 
位 功能 的 支撑 ， 职 位 扇 出 度 越 大 代表 任职 者 需要 越 强 的 协调 沟通 和 领导 能 力 。 

(6) 可 替代 性 : 这 个 变量 主要 说 明 职 位 的 任职 人 选 通过 内 部 晋升 或 外 部 招聘 获取 是 否 
容易 ， 有 的 职位 掌握 组 织 发 展 的 关键 资源 .造成 了 任职 人 员 的 不 易 替 代 ， 提高 了 替代 
成 本 。 

(7) 组 织 环境 熟识 度 : 某 些 职位 的 任职 者 需要 对 组 织 的 方方面面 的 信息 有 整体 和 深入 
地 把 担 ， 特 别 是 组 织 的 财务 、 运 营 和 战略 规划 实施 等 信息 。 信 息 的 获取 主要 通过 正规 汇 
道 ， 也 可 能 通过 非 正式 组 织 等， 组 织 环 境 熟 识 度 从 一 定 程度 上 反映 了 职位 对 组 织 的 影 
响 力 。 

参照 企业 的 职位 说 明 书 ， 采 用 7 分 制 对 各 个 职位 对 应 的 指标 进行 打分 。 数 据 资 料 如 
表 7-7 所 示 。 
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表 7-7 各 职位 聚 类 因素 得 分 表 





































































































工作 组 织 
职位 | 职位 名 称 | 职位 权力 | 复杂 性 | 教育 与 | 知识 与 | 职位 可 蔡 二 
代码 和 责任 和 难度 专业 经 验 | ”技能 扇 出 度 代 性 舒适 度 
1 生产 总 监 7 7 6 9 6 6 
区 供应 部 经 5 5 4 4 5 6 5 
3 生产 计划 6 6 6 4 归 6 6 
4 机 电 设备 4 4 5 5 5 5 5 
5 计划 主管 4 5 5 上 站 4 6 
6 生产 主管 & 5 5 6 
从 生产 调度 5 昌 4 § 
8 车 间 主 管 4 Ss 4 5 
9 工艺 主管 5 5 4 
10 生产 工人 1 1 
11 安全 技工 2 2 2 
12 设备 维护 2 六 3 2 
13 营销 总 监 7 NA 党 6 
-- 

14 客服 部 经 :a WS 4 § 
15 各 办 事 处 6 > 二 6 6 5 
16 | 用 户 质量 Xe 3 3 4 
17 销售 内 勤 引入 2 1 和 
18 促 人 六 1 2 1 1 
19 二 7 入 7 
20 证 券 投 次 5 6 5 5 
21 投标 主管 4 5 4 4 
22 出 纳 2 2 2 2 

需要 分 析 的 问题 : 

(1) 根据 职位 在 组 织 内 的 职业 发 展 水 平 ， 对 其 进行 分 族 。 

(2) 针对 不 同 职业 发 展 水 平 的 职位 族 ， 给 出 具体 的 职业 发 展 建议 。 

一 、 学 习 目 标 

通过 本 案例 的 学 习 ， 要 求学 生 熟 练 掌握 聚 类 法 的 基本 步骤 及 其 应 用 ; 考核 学 生 对 聚 类 

法 的 理解 程度 。 
二 、 案 例 分 析 


1. 应 用 SPSS 软件 对 数据 进行 处 理 

首先 采用 系统 聚 类 法 对 职位 样本 进行 聚 类 ， 个 体 之 间距 离 选 择 平 方 欧 氏 距离 ， 个 体 与 
小 类 之 间距 离 选 择 组 间 平 方 链 锁 距离 ,软件 输出 全 序 的 聚 类 冰 柱 图 ， 如 图 7.4 所 示 。 

然后 用 系统 聚 类 法 对 各 职业 发 展 水 平 变量 进行 聚 类 ， 输出 全 序 冰 柱 图 ， 如 图 7.5 所 示 。 


Number of clusters 


Number of clusters 
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Case 
六 





图 入 4、 职位 聚 类 分 析 冰 柱 图 


Case 


知识 与 ”yr “教育 与 工作 复杂 组织 环境 。 、 职位 职位 权力 
技能 专业 经 验 ”性 和 难度 舒适 雇 肩 出 度 可 和 蔡 代 性 和 责任 











7.5 聚 类 变量 聚 类 分 析 冰 柱 图 
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采用 开 - Means 聚 类 ， 通 过 调整 及 的 取 值 ， 可 得 到 不 同 聚 类 结果 。 当 所 有 职位 聚 为 4 
类 时 ， 各 类 集中 度 较 好 ， 类 之 间 区 分 度 也 较 好 ,软件 自动 选 表 取 和 聚 类 中 心 ， 结 果 如 表 7 一 8 
















































































所 示 。 
表 7-8 聚 类 职位 族 类 归属 表 

Case Number 职位 名 称 Cluster Distance 
| 生产 总 监 1 .000 
名 供应 部 经 3 2. 646 
3 生产 计划 3 2. 828 
4 机 电 设备 3 站 2. 449 
5 计划 主管 sR 了 2. 449 
6 生产 主管 EON 1.732 
T 生产 调度 六 和 .000 
8 车 间 主 管 XT 和 2. 449 
9 工艺 主管 / 有 > 3 2. 236 
10 生产 SRN .000 
11 _ 人 732 
12 ,设备 维护 Xe 12 3.162 
13 | XX en 1.414 
14 、， < 客服 部 经 tS 3 2. 646 

他 

15 NS 各 办 事 处 3 2. 646 
16 用 户 质 量 4 2. 000 
17 销售 内 勤 2 2. 236 
18 促销 员 2 000 
19 财务 总 监 2. 000 
20 证 券 投资 3 .000 
21 投标 主管 3 3.162 
22 出 纳 2 2. 000 

结果 分 析 : 

在 职位 聚 类 的 冰 柱 图 中 (图 7.4)， 由 左 至 右 可 分 为 4 族 ， 分别 是 {10,11,12,17,18,22)、 
{(2,4,5,7,8.9,14.16,21}、{3,6.15.20)、{1,13.19}， 它 们 分 别 对 应 职业 发 展 水 平 由 低 到 


高 的 4 个 职位 族 。 根 据 企 业 向 心 型 职业 发 展 通道 的 思想 ， 分 别 将 其 命名 为 “辅助 职位 族 、 
一 般 职 位 族 、 关 键 职 位 族 、 核 心 职位 族 ”。 如 果 分 为 5 个 职位 族 ，{7,16》 就 会 从 原 有 的 一 
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般 职 位 族 中 分 离 出 来 ， 说 明 一 般 职位 族 聚合 度 相对 较 差 。 整 体 看 来 ， 这 种 通过 层次 聚 类 得 

到 的 各 职位 族 的 职位 分 布 比较 符合 大 型 企业 金字 塔 式 的 人 才 结 构 ， 有 利于 形成 企业 的 人 才 
发 展 梯队 。 

由 开 -Means 聚 类 的 最 终 聚 类 中 心 ( 表 7-6) 可 以 看 出 : 1 类 对 应 核心 职位 族 ， 包 括 
{1,13,19); 3 类 对 应 关键 职位 族 ， 包 括 {2,3,4.5,6,8,9,14,15,20,21); 4 类 对 应 一 般 职 
位 族 ， i {17,16); 2 类 对 应 辅助 职位 ， 包 括 {10,11,12,17,18,22)。 两 种 聚 类 方法 所 
得 到 的 结果 在 核心 职位 族 和 辅助 职位 放 充 公 相同 ， 盖 别 休 现在 闫 久 职位 诸 和 一 般 职 位 族 
这 种 差别 一 定 程度 上 是 由 于 聚 类 方法 的 原理 不 同 造成 的 。 

从 系统 聚 类 法 对 变量 进行 聚 类 得 到 的 冰 柱 图 (图 7.4)， 如 果 把 7 个 变量 聚 为 4 类 ， 则 首 
先 职位 权 责 与 可 替代 性 相关 度 最 高 ， 其 次 是 工作 复杂 度 与 教育 和 专业 经 验 ， 再 次 是 职位 肩 出 
度 与 组 织 环境 熟识 度 ， 最 后 是 知识 与 技能 。 这 个 乘 类 结果 与 对 这 具 莹 量 的 定义 也 很 闪 合 。 

2. 针对 不 同 职位 族 采取 不 同 的 职业 开发 策略 人 

职位 分 族 是 职位 族 管理 的 基础 ， 分 族 结 wi AR 组 织 
应 把 职位 所 处 的 族 类 与 员工 个 人 的 职业 发 展 阶段 相 结 冷 、 分 清 企业 组 织 当前 和 港 在 人 力 次 
源 需求 ， na od o OE YA 同时 ， 应 根据 不 同 
职位 族 的 具体 情况 采取 不 同 对 策 ， 开 展 相应 Se 

组 织 要 注意 不 同 旅 类 任职 者 职业 需求 所 外 围 辅助 职位 族 由 于 对 任职 员工 综 

合 能 力 要 求 比较 低 ， nt Rn 、 竞 争 力 ， 因 此 组 织 往往 忽 视 对 
这 部 分 员工 基本 需求 的 满足 ， 窜 贡 入 员工 的 不 注 和 名 开锅 织 应 关 关注 这 些 职位 的 任职 员 
二 着 力 改善 其 基本 生活 条 件 - [ 解 淡 生 活 中 出 现 的 具体 问题 ， 用 优秀 的 企业 文化 对 其 进行 
引导 。 > Xx 

一 般 职位 族 的 员 守 是 企业 组 织 的 主体 ， 成 项 示 和 情 让 需求 外 于 主导 地 位 。 组 织 要 和 
造 良好 的 组 织 文化 " 征 同 事 之 间 、 伙 伴 冯 间 的 关系 融洽， 保持 友谊 和 中 诚 ; 深 雪 关 注 员工 
的 情感 需求 ,久之 总 受 到 组 织 的 温暖 ， 有 一 种 属于 一 个 群体 的 荣 炊 感 和 归 届 感 ， 形成 共同 
的 组 织 信仰 ， 引 导 员 工 不 断 提高 自己 ， 做 好 本 职工 作 ; 根据 组 织 发 展 战略 ， 定 期 举行 各 种 
培训 和 职业 生涯 咨询 活动 ， 引 导 和 帮助 员工 确立 职业 发 展 方向 ， 降 低 员工 的 失落 感 和 挫折 
感 ， 通 过 组 织 网 络 信息 平台 ， 发 布 组 织 的 发 展 信息 ， 使 员工 看 到 自己 在 这 个 组 织 的 希望 和 
目标 ， 从 而 达到 稳定 员工 队伍 的 目的 。 

关键 职位 族 的 员工 处 于 组 织 的 中 层 ， 对 组 织 环境 很 虽 负责 组 织 战略 的 具体 实施 ， 
在 本 组 织 还 有 一 定 的 上 升 空间 。 他 们 具有 很 强烈 的 社交 需求 ， 需 要 不 断 维护 和 扩展 自己 的 
业务 圈子 ,以 求 与 其 他 业务 关联 单位 建立 融洽 的 关系 ,赢得 下 属 的 尊重 和 进一步 的 职业 发 
展 。 这 部 分 人 在 外 部 人 才 市 场 上 有 很 强 的 竞争 力 ， 也 容易 接受 到 其 他 组 织 的 洲 请 。 对 于 这 
类 职位 ， 要 充分 满足 其 受 尊重 的 心理 需求 。 组 织 不 要 过 分 集权 ， 要 采取 柔性 管理 ， 给 关键 
职位 族 留 下 一 定 的 决策 室 间 、 回 旋 余地 ; 建立 及 时 准确 的 绩效 信息 反馈 系统 ， 对 关键 职位 
族 的 表现 给 出 积极 正面 的 评价 ， 督 促 其 执行 组 织 决 策 ; 组 织 进行 重大 抉择 时 要 多 征求 他 们 


的 意见 。 核 心 职位 族 的 员工 负责 制定 组 织 战略 ,他们 是 组 织 发 展 的 导向 ， 也 回 点 吕 回 
2 





悉 





是 需求 最 难 满足 的 群体 。 他 们 更 多 地 追求 自我 价值 的 实现 ,往往 从 组 织 的 发 强 
展 和 成 功 中 获取 满足 。 组 织 需要 为 这 些 职 位 的 员工 创造 相对 宽松 的 环境 ， 提 
供 足 够 的 资源 支持 ， 并 制订 行 之 有 效 的 激励 方案 。 【研究 课题 】 
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本 章 小 结 





聚 类 分 析 是 根据 研究 对 象 的 特性 ， 对 其 进行 定量 分 类 的 一 种 多 元 统计 方法 。 聚 类 
分 析 的 研究 主要 基于 距离 的 聚 类 ， 一 个 高 质量 的 聚 类 分 析 结 果 ， 将 取决 于 所 使 用 的 聚 


类 方法 。 本 章 讲 述 了 SPSS 统计 分 析 软 件 中 涉及 聚 类 分 析 的 基本 理论 及 方法 ， 主 要 包 
括 以 下 内 容 : Q 型 聚 类 、R 型 聚 类 、 距 离 、 相 似 系数 、 系 统 聚 类 法 。 





关键 术语 入 


Classify 分 类 Clus 全 ysis 聚 类 分 析 

Cluster method 聚 类 方法 isi A measure 距离 度量 

Correlation coefficient 相似 系数 be cluster 系统 聚 类 
XS Furthest neighbor method 最 长 距离 法 


Centroid clustering method 重心 pz Median clustering method 类 平均 法 


Ward's method Number of clusters 分 类 数 
Clustering criterion +" 类 数 准则 一 
党 让 DA 、 


二 


< 下 us » ~ x 
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Nearest neighbor method 短 距 离 法 AR 


习 题 7 
一 、 选 择 题 
1. 在 聚 类 分 析 中 ,根据 变量 对 样品 进行 分 类 称 为 ( )。 
A. Q 型 聚 类 B. R 型 聚 类 C. 系统 聚 类 D. K -均值 聚 类 
2. 聚 类 分 析 时 将 对 象 进行 分 类 的 依据 是 (  )。 
A. 变量 之 间 的 数值 的 大 小 B. 对 象 之 间 的 差异 程度 
C. 类 间距 离 的 远近 D. 对 象 之 间 的 相似 程度 
3. 在 对 样本 进行 分 类 时 ,度量 样品 之 间 的 相似 性 时 使 用 ( )。 
A. 类 间距 离 B. 点 间距 离 
C. 夹 角 余弦 D. Pearson 相关 系数 


4. 在 对 变量 进行 分 类 时 ,度量 变量 之 间 的 相似 性 时 使 用 ( 。 )。 
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聚 类 分 析 
A. 类 间距 离 和 点 间距 离 B. 欧 氏 距离 和 Block 距离 
C. 平方 欧 氏 距离 和 Block 距离 D. 夹 角 余弦 和 Pearson 相关 系数 
5. 进行 聚 类 分 析 时 ， 要 求 用 于 聚 类 的 各 变量 的 取 值 C(  )。 
A. 应 该 接近 相等 B. 应 该 有 较 强 的 相关 关系 
C. 应 该 有 数量 级 上 的 较 大 差异 D. 不 应 该 有 数量 级 上 的 较 大 差异 
二 、 简 答题 
1. 区 别 下 列 概念 。 
(1) Q 型 聚 类 与 R 型 聚 类 。 
(2) 系统 聚 类 法 与 K -均值 聚 类 法 。 
(3) 距离 与 相似 系数 。 
2. 什么 是 聚 类 分 析 ? 聚 类 的 依据 是 什么 ? 
3. 简 述 系统 聚 类 法 的 基本 思路 。 vv 从 
Sete 
5. 常用 的 距离 及 相似 系数 有 哪些 ?它们 各 有 什么 特 # 
6. 聚 类 分 析 之 前 一 定 要 对 变量 进行 标准 化 吗 穴 为 什么 ? 
三 、 判 断 是 X AN 
和 ) 
2. 在 进行 聚 类 分 析 时 不 需 对 数据 标准 化 。 C0 


3. 距离 是 描述 指标 间 亲 琉 程 度 的 分 类 统计 量 ， 相 似 花 数 是 描述 样品 间 亲 琉 程 度 的 分 
类 统计 量 。 A 2 WX ( ) 
4. 用 相似 系数 作为 蔬 程 度 的 度量 值 时 ， 相 做 系数 的 绝对 信 越 大 ， 说 明 指 标 之 间 的 


Ng ¢ 


关联 性 越 小 。 -去 | a NV 
用 站 有 人 度 人 时 -区 从 起 修 说 村 之 风头 芭 大， 
| ( ) 
6. 系统 聚 类 法 的 聚 类 效果 与 分 类 统计 量 的 选择 及 类 间距 离 的 定义 都 有 关 。 ( ) 
7. 在 系统 聚 类 分 析 中 ,事先 已 确定 类 别 数 。 ) 
8. 一 般 而 言 ， 不 同 的 聚 类 方法 的 结果 不 完全 相同 。 « ) 
9. 不 同 的 聚 类 方法 可 能 得 到 不 同 的 结果 ,选用 何 种 结果 ,可 以 结合 专业 知识 判断 。 
(a) 
10. 对 于 一 个 具体 问题 ， 可 以 试探 各 种 聚 类 方法 。 ( ) 


四 、 计 算 题 
1. 考虑 下 列 4 个 样品 的 距离 矩阵 
(六 3 


W/O 

D=(2)| 1 0 
(3) | 11 2 0 
(4)\5 3 4 0 














最 短 距离 法 和 最 长 距离 法 对 这 4 个 样品 聚 类 ， 画 出 谱系 聚 类 图 。 
设 有 5 个 变量 Xi ,Xz ,Xs ,Xi,Xs， 它 们 之 间 的 相关 系数 矩阵 为 





Lg 
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Xi X2 Xs X4 Xs 
Xi 1 
X2| 0.643 1 
Xs | 一 0.082 ”一 0.086 1 
Xs | 0.045 0.211 一 0. 164 
Xs\—0.013 ”一 0.328 0. 486 一 .185 1 


以 R 作为 各 变量 间 的 相似 性 度量 ， 利 用 最 短 距离 法 对 这 5 个 变量 做 聚 类 分 析 ， 面 出 谱 
3. 设 有 5 个 样品 ， 每 个 样品 测 两 个 指标 X! 和 X2， 如 表 7 一 9 所 示 。 
表 7-9 两 个 样品 的 指标 数据 
样品 号 1 2 3 . 险 5 
Xl 1 —1 -2 A> 3 




















XX: 5 二 二 入/ 1 = 0 





用 欧 氏 距离 度量 样品 间 的 距离 ， a 并 面 出 谱系 聚 
类 图 。 天 必 

4. 表 7-10 是 某 聚 类 的 进程 表 ， 斌 和 抵 这 个 进程 表 ， 

表 7>i0、 WAgglomeration Scehed 1 





ms 7 
C7 NS Cluster First 
Cluster Combined 2 总 人 四 
Stage 和 = ed < Appears Next Stage 
x — 
Cluster 4 + luster 2 so RS Cluster 1 Cluster 2 
Nr 工 = 
1 SN 4 582289 0 0 2 


2 Y 3 120. 810 0 1 3 
































3 } 2 179. 647 2 0 0 


五 、 上 机 实验 题 
1. 某 中 学 从 高 中 女生 中 随机 选取 16 名 学 生 ， 测 得 身高 和 体重 如 表 7 -11 所 示 。 若 样 
品 间 采 用 欧 氏 距离 ， 试 进行 Q 型 聚 类 分 析 。 
表 7-11 某 高 中 女生 16 名 学 生 的 身高 和 体重 


















































序号 1 2 3 4 5 6 7 8 
身高 /em 160 159 160 157 169 162 165 154 
体重 /kg 49 46 53 41 49 50 48 43 

序号 9 10 1 12 13 14 场 16 
身高 /em 160 160 157 163 161 158 159 161 
体重 /kg 15 44 43 50 51 45 48 48 





2. 为 了 了 解 2014 年 江苏 省 13 个 地 区 的 经 济 发 展 水 平 ， 现 选取 4 项 指 
(X1)， 第 一 产业 GDP 占 总 GDP 的 比例 (X: )， 第 二 产业 GDP 占 总 GDP 的 比例 (X;)， 
第 三 产业 GDP 占 总 GDP 的 比例 (Xs)。 数 据 资料 如 表 7 - 12 所 示 ， 要 求 使 用 聚 类 分 析 方 
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标 : 人 均 GDP 
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法 ,将 江苏 13 个 地 区 分 成 4 类 。 
表 7-12 2014 年 江苏 省 13 个 地 区 的 经 济 发 展 状况 (单位 : 元) 
三 次 产业 占 GDP 比重 /% 

ee Cs 第 产业 ”| 第 = 产业 ”| ”第 产业 
南京 市 107545 2.4 41. 1 56.5 
无 锡 市 126389 机 49.9 48.4 
徐州 市 57655 9.5 45.3 入 45.2 
常州 市 104423 2 / 48. 0 
苏州 市 129925 1 ， CN 48.4 
南通 市 77457 6.0 A WU 49.8 44.2 

连云港 市 44277 13a3, AN 45. 3 41. 4 


























3. 为 了 更 深入 了 解 我 











省 统计 年 鉴 (2015)》。 | 

















高 等 学 校 教育 经 费 收入 情况 ， 现 利用 2014 年 全 国教 育 经 费 数 


据 对 全 国 31 个 省 、 自 治 区 、 直 辖 市 进行 聚 类 分 析 。 分 析 选 用 了 3 个 指标 :预算 内 教育 经 
费 拨款 (Xi ) 、 捐 集资 收入 〈(X: )、 事 业 收入 (Xs )， 分别 用 来 反映 各 类 教育 经 费 收入 的 
状况 。 试 计算 样品 之 间 的 相似 系数 ， 使 用 最 长 距离 法 、 重 心 法 和 Ward 法 ,将 上 机 结果 按 
样品 号 画 出 聚 类 图 ， 并 根据 聚 类 图 将 30 个 样品 分 为 4 类 。 数 据 资料 如 表 7 一 13 所 示 。 























表 7-13 2014 年 全 国教 育 经 费 数 据 (单位 : 万 元 ) 
地 区 预算 内 教育 经 费 社会 捐赠 收入 事业 收入 
北京 8941899 8560 855343 
天 津 4986021 7631 632387 
河北 8523960 6637 1606017 
山西 5716634 4494 1043347 
内 蒙古 5546840 4017 515753 
辽宁 7766499 2074 1415382 
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( 续 ) 
地 区 预算 内 教育 经 费 社会 捐赠 收入 事业 收入 
吉 4623684 5859 750332 
黑龙 江 5126395 1368 836690 
上 海 7640400 6397 1141498 
江苏 15765569 123770 3168318 
浙江 10890610 56997 2780301 
安徽 8594589 14121 1638949 
福建 6514206 46843 1431102 








江西 6932770 9378 i 1214374 


山东 14995863 2 SN 2562457 
河南 12650584 人 2 | 2470745 
湖北 6697669 CY Ws 1811299 
湖南 8449160 ,XN 14113 1978319 
广东 18505746 108921 5492403 
广西 654Q555 SS 8998 1136774 
海南 ES x i 326227 
人 
1 



























































重庆 » ”5928011 Xe 731 1088175 
四 川 ” 二 11225895 SS “33563 2272207 
PASS 一 
贵州 “ST 5954134 | 10604 678610 
上 了 i 
云南 7820920 | 25631 917660 
西藏 1182000 1567 18183 
陕西 7246693 7938 1474355 
甘肃 4265005 4858 490552 
青海 1468671 1057 70331 
宁夏 1385750 3663 145841 
新 疆 5504391 13687 299414 





资料 来 源 :《 中 国 统计 年 鉴 2015》。 


4. 某 大 学 为 了 了 解 信息 管理 与 信息 系统 专业 的 课程 结构 ， 随 机 抽取 30 人 16 门 主要 课 
程 的 成 绩 ， 有 英语 (X1)、 马 克 思 主义 政治 经 济 学 原理 (Xs)、 管 理学 原理 (Xs)、 高 等 
数学 (Xs)、 计 算 机 文化 基础 (Xs )、 经 济 学 (Xs )、 体 育 〈Xr)、 管 理 信息 系统 (Xs)、 
概率 论 与 数理 统计 (Xs)、 毛 泽 东 思想 概论 (Xio)、 马 克 思 主义 哲学 原理 (X11)、 应 用 统 
计 技 术 (Xis)、 专 业 英语 (X13)、 数 据 结构 (X11)、 运 筹 学 (Xis)、 计 算 机 网 络 (X16)。 
统计 资料 如 表 7 一 14 所 示 。 
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聚 类 分 析 
要 求 先 对 数据 进行 标准 化 变换 ,再 采用 最 长 距离 法 将 16 项 指标 分 成 8 类 。 
表 7-14 30 个 学 生 16 门 课程 考试 成 绩 统计 

序号 | X | 和 | 下 | 和 | 和 | 和 | 和 | 和 | 和 | Xo | Xu | Xa | Xs | Xu | Xs | Xi 
1 86 83 83 86 76 90 84 87 76 66 84 80 83 62 81 70 
2 最 90 79 89 85 12 80 84 92 81 82 87 90 63 76 94 
3 60 74 72 87 86 86 62 88 89 82 67 88 90 15 86 84 
4 2 78 88 87 85 94 70 89 88 80 79 82 73 54 70 73 
5 70 7 90 85 80 81 75 88 83 83 82 85 81 67 90 58 
6 62 80 71 87 85 Ty 80 87 87 86 82 78 83 63 76 72 
7 67 64 73 83 85 81 60 85 74 72 56- | 80 36 88 好 
8 73 75 79 75 80 90 63 88 80 82 61 84 80 
9 2 75 90 89 76 79 50 91 75 84 54 81 88 
10 84 67 73 50 77 60 
11 75 74 90 60 ?3 ?3 
12 64 86 81 79 87 82 
13 75 80 78 72 78 60 
14 86 81 86 46 83 80 
15 69 75 81 60 78 66 
16 60 69 80 64 73 65 
可 74 87 90 88 90 81 
18 64 76 84 69 74 85 
19 68 91 93 89 92 93 78 91 90 81 83 84 86 88 90 84 
20 75 80 78 83 81 82 86 78 94 79 ?9 93 91 67 85 80 
21 72 80 83 86 85 82 72 80 84 86 68 75 84 86 90 80 
22 汪 75 85 85 86 83 83 79 90 好 69 79 81 62 74 85 
23 74 82 74 80 78 76 77 82 80 84 68 65 81 54 81 70 
24 78 73 78 83 83 80 67 84 83 63 75 75 84 83 80 57 
25 82 82 85 89 87 85 60 80 84 81 83 81 75 62 82 80 
26 67 90 D1 89 81 87 75 90 90 73 80 71 83 77 75 74 
27 69 83 66 89 85 ns 70 89 90 86 82 90 85 82 87 90 
28 84 82 80 87 78 92 60 89 85 64 81 72 82 50 83 60 
29 83 87 84 85 78 87 75 91 90 78 85 85 84 65 83 76 
30 63 76 82 80 80 86 75 85 90 85 73 86 82 75 88 70 
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1. 实 训 项 目 ， 全 国 31 个 城市 社会 经 济 发 展 指标 的 聚 类 分 析 

实 训 目的 ， 学 会 运用 网 络 资源 查找 数据 资料 ， 会 利用 系统 聚 类 法 对 样品 进行 聚 类 ， 会 
运用 SPSS 软件 进行 聚 类 分 析 ， 并 对 输出 结果 给 出 合理 的 解释 。 

实 训 内 容 , 近年 来 一 些 地 方 城市 的 发 展 的 一 个 突出 问题 是 发 展 具有 片面 性 ， 如 经 济 发 
达 ， 但 政治 文化 等 各 方面 的 建设 比较 落后 。 请 收集 全 国 31 个 省 会 城市 〈 含 自治 区 、 直 连 
市 ) 2016 年 相应 的 人 均 地 区 生产 总 值 、 人 均 公 共 图 书馆 藏书 、 职 工 平 均 工资 、 人 均 绿地 
面积 、 每 万 人 拥有 公共 汽车 等 5 个 指标 来 考察 31 个 城市 发 展 的 协调 状况 ， 根 据 这 5 个 指 
标 将 31 个 城市 进行 取 类 ， 分 析 各 类 的 特点 。 利 用 本 章 学 到 的 理论 和 方法 进行 聚 半分 析 的 
实践 。 需 要 分 析 的 问题 如 下 SR 

(1) 将 31 个 城市 按 社会 经 济 发 展 状况 进行 分 类 A 

or 济 发 展 状况 存在 什么 问题 ? 





























身 昌 

2. 实 训 项 目 : 全 国 20 余 家 电力 上 市 公司 绩 Se 

实 训 目 的 ,学 会 运用 网 络 资源 查找 数据 会 利用 系统 聚 类 法 对 变量 进行 聚 类 ， 会 
运用 SPSS 软件 进行 聚 类 分 析 ， 并 对 输 结果 给 出 合理 的 解释 。 

实 训 内 容 : 目前 我 国 i 力 公 司 有 40 余 家 ; 请 从 “中 国 上 市 公司 资讯 网 ” 
公布 的 2016 年 电力 上 市 公司 数据 中 和 性 选 20 家 数据 ， 进 行 聚 类 分 析 。 所 需 10 个 相关 指标 依次 
为 : 销售 净利 率 〈 单 位 :2 六 经 营 净 现 金 比 率 〈 单 往 2%D 、 总 资产 周转 率 〈 单 位 ; 倍 )、 固 
定 产 有 转 率 《单位 全 主 罕 业 务 收入 增长 《得 :96)、 总 资产 增长 闪 《单位 :20 
净 资 产 收益 率 《单位 六合。 股东 权益 比率 ;C 谍 位 品 ) 、 股 东 权 益 周 转 率 “ 单 位 ， 售 ) 和 净 次 
产 增长 率 “〈 单 位 Yo 人 ) 等。 需要 分 析 的 问题 : 研究 评价 各 变量 指标 之 间 的 关系 及 所 属 类 型 。 

3. 实 训 项 旧 : 全 国 各 地 区 卫生 医疗 水 平 的 高 低 分 析 

实 训 目 的 : 学 会 运用 网 络 资源 查找 数据 资料 ， 会 利用 系统 聚 类 法 对 样品 进行 聚 类 ， 会 
运用 SPSS 软件 进行 聚 类 分 析 ， 并 对 输出 结果 给 出 合理 的 解释 。 

实 训 内 容 : 为 研究 全 国 各 地 区 卫生 设施 情况 ， 请 查找 全 国 31 个 省 、 自 治 区 、 直 辖 市 
卫生 设施 相关 指标 ， 具 体 为 医疗 机 构 床 位 数 〈( 张 )、 卫 生机 构 人 员 数 、 妇 幼 保健 院 〈 所 、 
站 ) 数 、 疾 病 预 防 控制 中 心 〈 防 疫 站 ) 数 、 门 诊 部 数 、 诊 所 数 、 卫 生 院 数 、 医 院 数 等 。 需 
要 分 析 的 问题 如 下 

(1) 利用 系统 聚 类 法 对 样品 进行 聚 类 ， 分 析 各 地 区 卫 和 4 

(2) 各 个 类 别 之 间 的 区 别 是 什么 ”每 个 类 别 自身 的 卫 4 


[< 果 例 思考 与 讨论 



































医疗 水 平 的 高 低 。 
医疗 发 展 存 在 什么 问题 ? 











[a 





精准 化 营销 : 细 分 市 场 瞄准 客户 


总 部 位 于 上 海 的 菜 期 货 公司 ,在 各 期 货 交 易 所 分 别 拥有 两 个 以 上 席位 并 且 成 交 量 名 列 
前 芒 , 是 目前 国内 最 具 影 响 力 的 期 货 经 纪 公 司 之 一 。 公 司 客 户 数量 约 5000 左右 ， 大 多 分 
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布 于 华东 地 区 。 其 中 ，10 叶 6 是 重要 客户 ， 其 余 避 为 散户 。 目前， 我 国 期 货 行 业 正 进 入 新 一 
轮 的 发 展期 。 在 政策 及 市 场 的 双重 驱动 下 ， 该 行业 将 进行 大 规模 的 兼并 重组 和 增资 扩 股 
同时 其 他 行业 对 期 货 公司 的 渗透 也 在 不 断 加 快 ， 而 争夺 的 焦点 必定 是 客户 。 公 司 管理 层 意 
识 到 在 服务 日 趋同 质 化 、 市 场 竞争 越 来 越 激烈 的 当下 ， 有 效 的 客户 细 分 不 仅 是 必然 ， 也 是 
必须 的 。 企 业 资源 的 有 限 性 决定 了 企业 只 有 锁定 特定 的 客户 ， 才 能 最 有 效 地 发 挥 出 最 大 的 
竞争 优势 。 
面临 问题 及 需求 : 
该 期 货 公司 在 客户 管理 方面 面临 的 主要 问题 客户 成 分 较 复杂 ,管理 客 户 的 难度 较 
大 。 作 为 期 货 业 ， 公 司 客户 具有 以 下 显著 特点 : 
(1) 客户 的 差异 性 。 客户 之 间 存 在 较 大 的 差异 性 。 从 规模 上 看 ， 大 到 机 构 大 户 ， 小 到 
中 户 、 散 户 ;， 从 投资 经 验 来 说 ， 有 多 年 的 老手 和 刚 来 的 新 手 。 
(2) 客户 的 高 转移 风险 。 公 司 客户 尤其 是 大 客户 存在 着 较 大 的 转移 风险 。 这 主要 是 由 
于 期 货 公司 向 客户 提供 的 服务 基本 上 是 同 质 的 ， 而 客户 身 湖 器 生 了 变化 。 现 在 的 客户 更 
加 理智 。 因 此 ， 影 响 客户 去 留 的 关键 因素 在 于 能 否 为 密 靖 提供 既 合 理 又 相 适 的 服务 。 
(3) 客户 的 低 扩张 性 。 虽 然 最 近 几 年 期 货 此 的 篇 户 数量 有 了 一 定 的 增长 ， 但 是 这 种 增 
长 幅度 运 运 小 于 市 场 预期 。 再 加 上 期 货 业 的 客户 基数 本 来 就 很 小 (40 万 ~50 万 )， 客 户 的 
扩张 异常 绥 慢 。 人 
目前 ， 公 司 对 客户 按照 交易 量 、 交 其 方式 等 指标 进行 了 一 定 程度 的 粗略 细 分 ， 但 尚未 
形成 行 之 有 效 的 完整 体系 ， 且 细 分 多 是 手工 完成 ， 在 处 理 汪 此 数据 量 大 、 复 杂 的 细 分 任务 
时 显得 力不从心 ， 无 从 下 手 7 这 样 渤 来 了 一 系列 问题 首先， 给 客户 提供 的 咨询 服务 和 投 
资 建议 没有 针对 性 ， 其次 信 定 手续 党 讶 目 ， 表 现 为 对 站 起 客户 降低 收费 ， 影 响 公司 收益 
对 成 长 型 客户 收费 让 高 ， 生 到 其 流失 等 ; 再 者 从 由 于 不 明确 客户 对 公司 的 不 同 价值 ， 全 得 
公司 的 资源 投资 同 报 系 较 低 。 Wa 
针对 这 些 问 ES 公司 希望 借助 信息 技 相 和 先进 的 管理 思想 优化 其 客户 细 分 ， 为 公司 把 
握 客 户 、 提 供 莽 异化 服务 ， 改 善 市 场 格局 和 增收 增 利 提供 决策 依据 。 
思考 与 讨论 以 下 问题 
(1) 该 期 货 公 司 应 该 如 何 对 客户 细 分 ?〈 可 先 对 客户 进行 价值 预测 ， 再 进行 聚 类 细 分 ) 
(2) 如 何 看 待 “客户 细 分 ”在 企业 客户 管理 中 的 作用 ? 
(3) 接 下 来 客户 管理 的 重点 是 什么 ? 
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在 实际 问题 中 ， 人 们 设计 调查 表 或 通过 做 实验 收集 到 大 量变 量 (指标 ) 的 数据 ， 以 便 进行 


分 析 寻 找 规律 。 多 变量 大 样本 无 疑 会 为 科学 研究 提供 丰富 的 信息 ， 


但 也 在 一 定 程度 上 增加 了 数 


据 采集 的 工作 量 。 更 重要 的 是 ， 在 大 多 数 情况 下 ， 许 多 变量 之 间 存 在 的 相关 性 增加 了 问题 分 析 
的 复杂 性 。 因 此 需要 找到 一 个 合理 的 方法 ， 在 减少 分 析 变量 的 同时 ， 尽 量 减 少 原 变 量 包含 信息 
的 损失 ， 对 所 收集 的 资料 做 全 面 的 分 析 。 主 成 分 分 析 与 因子 分 析 就 是 这 样 的 降 维 


| 
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【拓展 知识 】 


映 的 主要 信息 ， 





合 评价 ; 图 可 以 对 变量 进行 分 类 。 


方法 ， 它 可 以 在 众多 的 变量 中 ， 找 出 少数 几 个 综合 性 变量 ， 来 反映 原来 变量 所 反 
使 问题 简化 。 主 成 分 和 因子 分 析 的 作用 在 于 : 四 能 降低 所 研究 的 
数据 空间 的 维 数 ; 回 可 以 用 于 分 析 算 选 回归 变量 ， 构造 回 归 模 型 ; 回 可 以 用 于 综 
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主 成 分 分 析 在 企业 经 济 效益 评价 中 的 应 用 


经 济 效益 是 评价 一 个 企业 经 营 情况 好 坏 的 重要 标准 之 一 。1994 年 以 来 ， 我 国 评价 企业 经 济 效益 的 指 
标 体 系 大致 经 历 了 一 个 由 繁 到 简 的 过 程 。20 世纪 50 年 代 其 考核 指标 是 27 项 ，60 年 代 简化 为 17 项 ，70 
年 代 又 简化 到 8 项 ， 这 些 指标 都 是 计划 经 济 体制 的 共生 物 。 到 了 1982 年 ， 国 家 根据 当时 经 济 形势 的 需 
要 ， 颁 布 了 16 项 主要 经 济 效益 指标 ， 从 中 选 出 了 10 项 作为 企业 经 济 效益 动态 考核 指标 。1983 年 ， 国 家 
计 委 对 其 进行 了 部 分 修改 ,沿用 到 1992 年 ， 国 家 统计 局 又 将 其 修改 为 6 项 。 可 以 肯定 地 说 ， 我 国企 业经 
济 效益 评价 指标 体系 所 走 过 的 上 述 轨 迹 ， 每 一 步 都 深 深 地 打 着 当时 经 济 环境 的 烙印 。 也 正 是 这 个 道理 ， 
为 了 适应 我 国 社会 主义 市 场 经 济 的 发 展 和 建立 现代 企业 制度 的 现实 需要 ， pe 
上 ， 从 各 种 评价 企业 经 济 效益 指标 中 和 萍 选 出 了 10 项 指标 ， 构 成 了 一 近 国际 通行 做 法 的 新 的 经 济 
效益 评价 指标 体系 ， 并 从 1995 年 开始 试点 推广 ， 于 1998 年 全 国 至 今 。 改 进 后 的 指标 体系 ， 具 
有 较 好 的 科学 合理 性 、 很 强 的 可 操作 性 ， rp ee 有 助 于 引导 
企业 改变 过 去 习惯 了 的 粗放 经 营 方式 ， 实 现 经 济 增长 方 ea 

资料 来 源 ， https: //wenku. baidu. com。 A 


re ee 提高 评价 的 全 面 
性 和 科学 性 。 但 是 ， 出 现 了 新 的 问题 pp ee ed 
盾 的 情况 ， 因而 影响 对 评价 允 基 绑 时 间 和 空间 上 的 体 对 正 。 那 我 们 能 不 能 把 多 个 指标 
用 一 两 个 综合 指标 来 表示 ? 这 二 两 个 综合 指标 包含 大 多 少 原来 的 信息 ? 能 不 能 利用 找到 的 
综合 指标 来 对 企业 经 济 效 3 


网 在 损 员 稳 本 

















指标 的 多 元 统 从 而 ， 我 们 期 望 可 以 利用 主 成 分 分 析 方法 对 企业 的 经 济 效益 指标 进 
行 综合 评价 ,希望 能 得 到 综合 反映 各 企业 经 济 效益 强 弱 的 各 项 信息 ,而 且 可 以 确定 各 指标 
的 客观 权重 ， 由 此 指导 企业 的 决策 。 








如 何 对 学 生成 绩 进行 综合 评价 


据 南方 网 (http: //www. southen. com) 报道 ， 从 2007 年 开始 ， 广 东 高 考分 数 统计 方式 将 由 标准 分 
制 改 为 原始 分 制 ， 这 一 最 新 高 考 改革 方案 的 提出 ， 受 到 了 人 们 的 广远 关注 。 据 相关 负责 人 介绍 ， 此 举 主 
要 是 担心 考试 科目 中 的 文科 基础 和 理科 基础 ， 由 于 这 两 个 学 科 的 考试 属于 水 平 考试 性 质 ， 其 分 布 和 正 态 
分 布 的 差别 会 比较 大 ， 结 果 可 能 造成 人 为 夺 大 分 数 差 别 的 现象 。 采 用 原始 分 可 以 回避 这 一 问题 。 另 据 有 
关 专 家 介绍 ， 此 举 又 把 不 同学 科 之 间 的 基本 分 值 不 相等 ， 即 语文 的 1 分 和 数学 的 1 分 数值 不 相等 这 一 
来 标准 分 已 经 解决 的 问题 引 了 出 来 。 这 一 分 数 单位 不 等 值 的 问题 也 会 给 评分 结果 带 来 相当 严重 的 问题 。 

我 国 历来 是 采用 原始 分 数 报告 学 生 的 学 习 成 绩 ， 并 作为 选拔 考试 择优 录取 的 重要 依据 。 由 于 各 科 试 
题 难度 不 同 ， 学 生 各 科 成 绩 分 布 也 不 相同 因而 用 学 生 各 科 原 始 分 数 相 加 后 的 总 分 来 反映 学 生 个 体 在 总 
体 中 的 相对 位 置 有 较 大 的 局 限 性 。 为 了 克服 这 种 局 限 性 我国 在 1998 年 高 考 中 开始 实行 用 标准 分 录取 新 
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生 。 它 是 高 考 制 度 具 体 措施 的 一 大 改革 。 标 准 分 是 一 种 由 原始 分 推导 出 来 的 相对 地 位 量 数 ， 它 是 用 来 说 
明 原始 分 在 所 属 的 那 批 分 数 中 的 相对 位 置 的 。 但 是 截止 到 2017 年 ， 只 有 海南 省 还 在 使 用 标准 分 ， 其 他 省 
份 都 使 用 原始 分 录取 新 生 。 

资料 来 源 ， 南方 网 . http: //www. southen. com. 


可 以 看 出 ,无 论 是 用 原始 分 还 是 标准 分 ， 对 学 生成 绩 进行 综合 评价 时 都 存在 各 种 缺 
点 。 这 些 方法 对 学 生成 绩 评 价 过 于 笼统 ， 看 不 出 学 生 在 各 学 科 间 的 优势 与 劣势 ， 也 无 法 找 
出 影响 学 生 知识 和 能 力 的 主要 因素 ， 并 据 此 对 学 生成 绩 做 出 一 个 客观 、 综 合 的 评价 。 

当 我 们 对 学 生 的 学 习 成 绩 进行 综合 评价 时 ， 可 能 会 收集 到 诸如 数学 、 语 文 、 英 语 、 百 
米 、 仰 甲 起 坐 、 排 球 等 各 类 课程 的 成 绩 。 一 般 来 讲 ， 一 个 学 生 的 各 科 文 化 课 成 绩 之 间 有 一 
定 的 相关 性 ， 各 科 体 育 课 成 绩 之 间 也 有 一 定 的 相关 性 ， 而 文化 课 成 绩 和 体育 课 成 绩 之 间 的 
相关 性 就 不 大 。 因 此 ， 我 们 可 以 考虑 学 生 的 文化 课 成 绩 之 间 可 能 符 在 一 个 共同 的 影响 因 

子 ， 称 之 为 智力 因子 ;而 体育 课 成 绩 之 间 也 研 能 存在 个 共同 的 影响 因子 
轩 癌 加 。 称 之 为 体力 因子 。 而 因子 分 析 就 是 要 各 并 课程 的 成 绩 去 找寻 出 这 些 因子 
3 出 。 米 ， 并 且 还 能 找到 成 绩 与 因子 的 关系 .这 划 画 子 分 析 的 方法 对 学 生成 绩 进行 
@l¥ 分 析 ， 并 通过 分 析 的 结果 做 出 一 个 综 俗 评价， 这 样 可 以 比较 有 效 地 解决 其 他 
分 析 方 法 存在 的 问题 。 7 
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8.1.1 主 成 分 分 析 简 介 


次 YY 
1. 主 成 分 分 析 的 含义 
主 成 分 分 煌 就 是 用 较 少 的 几 个 综 en, 而 这 些 较 少 的 综合 变 
量 能 尽 可 能 多 地 反映 原来 变量 的 有 用 信息 ， 且 相互 之 间 又 是 无 关 的 ,这 些 综合 变量 就 称 为 
主 成 分 (Principal Components) 。 例 如 ， 上衣 尺 二 主要 包括 领 长 、 袖 长 、 衣 长 、 胸 围 、 袖 
宽 等 14 个 变量 ， 它 们 显然 是 相关 的 ， 因此 可 以 找 出 反映 上 衣 特 征 的 两 个 不 相关 的 综合 变 
量 ， 即 上 衣 的 型 号 ; 学 生 的 数学 、 物 理 、 生 物 、 政 治 、 语 文 、 历 史 、 地 理 等 7 科 的 学 习 成 
绩 之 间 也 是 明显 相关 的 ， 也 可 以 用 文科 和 理科 学 司 成绩 网 个 纤 合 变 各 来 反 了 其 主要 人 息 。 


2. 主 成 分 分 析 的 基本 原理 


主 成 分 分 析 就 是 考虑 各 变量 间 的 相互 关系 ， 
利用 降 维 的 思想 把 多 个 变量 转换 成 较 少 的 几 个 互 
人 那么 ， 怎 样 实现 变量 的 降 

例如 . 儿童 身高 (Xi ) 和 体重 (Xs) 两 个 变 
量 之 间 的 关系 可 以 用 散 点 图 表示 出 来 ， 如 图 8.1 
所 示 。 显 然 ， 这 两 个 变量 之 间 存 在 线性 关系 。 现 
图 8.1 变量 降 维 示意 图 在 以 直线 Pi 为 横 坐 标 。 以 该 轴 的 垂直 线 P; 为 纵 























坐标 ， 


测 值 
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根据 


式 中 ， 


三 者 
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建立 一 个 新 的 平面 直角 坐标 系 ， 则 所 有 观测 点 均 在 坐标 轴 Pi 周围 〈 即 沿 该 方向 观 
方差 最 大 ) ， 而 在 坐标 轴 P 方 向 上 的 波动 很 小 ， 可 以 忽略 。 这 样 。 二 维 问 题 即 可 以 降 
维 问题 ， 只 取 一 个 综合 变量 P，( 主 成 分 ) 即 可 。 
这 种 降 维 的 方法 ， 相 当 于 在 平面 上 做 一 个 坐标 变换 ， 即 按 逆 时 针 方 向 旋转 一 个 角度 0， 
旋转 变换 公式 ， 新 旧 坐标 之 间 有 如 下 关系 : 

了 :一 Xicosb 十 Xasin0 一 za1XI 十 xl2X2 

卫 : 王 一 Xisin0 十 Xzcosb 一 xz1X1I 十 xzzX2 
ivuzl via2 ,uzz 是 可 以 计算 出 来 的 ; 新 变量 P; 和 Pz 是 原始 变量 的 线性 组 合 ， 而 且 
相互 垂直 ， 即 新 变量 P1 和 Ps 不 相关 。 
一 般 来 说 ， 主 成 分 就 是 了 个 原始 变量 的 一 些 特殊 的 线性 组 合 ; 而 从 几何 上 看 ， 这 些 线 
合 正 是 由 Xi ,X: ,…,XP 构 成 的 坐标 系 经 旋转 而 产生 的 新 坐 慰 和 水 ， 新 坐标 系 使 之 通过 
最 大 的 方向 (或 者 说 具有 最 大 的 样本 方差 ) 。 /XK 
3, 主 成 分 分 析 的 数学 模型 
假设 有 nn 个 样品 ， 每 个 样品 观测 p 项 变量 X12，,…, 义 ，。， 原 始 数 据 资 
为 























(8=1) 








分 分 析 通 常 的 做 法 可 变量 KX1,X2 da P;， 其 数学 模型 是 
ey ‘+upXp 


XP pe A (8-2) 


Pp=upi Ki1+ups Xs *** Tupp Xp 


A\ Pi =un Xi tz 


P=wu Xit+uz Xt+**+upXp—=UTX (8—-3) 


U= (wu ,zz dp)T ,KX=(KXI ,KX2 ,KX,)T 
满足 如 下 的 条 件 : 
(1) P; 和 P; 不 相关 ， 即 Cov(P; ,Pj)==0 (i#j .i,j 二 1,2,"…,p)。 
(2) 主 成 分 的 方差 依次 递减 ,重要 性 依次 递减 D(P1) 宇 D(P;) 三 … 宇 D(P,), 称 P; 为 


第 i 主 成 分 (i==1.,2,…,p)。 


p p 
(3) 总 方差 不 变 , 即 >) DCX;) = >)D(P))。 
i=l 下 到】 
(4) 每 个 主 成 分 的 系数 平方 和 为 1， 即 局 十 性 十 … 十 必 一 1。 
求 主 成 分 就 是 寻找 瑟 的 线性 函数 UTX， 使 相应 的 方差 尽 可 能 地 大 ， 即 使 
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D(P)=D(UTX) 
=E[UTX—E(U TX)][U TX—E(U TX)]T 
=U TE(X—EX)(X—EX)T™U 
=UTEU 
达到 最 大 ， 且 UTU==1。 由 条 件 极 值 的 Lagrange 乘 数 法 ， 即 要 求 $= 二 D(P)==UT23U 一 A(UTU 一 1) 
为 最 大 即 可 。 令 


(8 一 4) 





絮 =220 一 20=0 (8—5) 


即 
(ZE—AE)U=0 


若 公式 (8 -5) 有 非 零 解 ， 则 | 一 AE | =0， 由 此 求 得 号 的 特征 值 41 ,ha ，… ,4 。 

设 4=; 为 马 的 一 个 特征 值 ， 则 由 (5 一 AE) U 一 0 可 习 和 U=Ui， 那 么 Ui 是 
也 的 对 应 于 特征 值 ) 一 Xi 的 单位 特征 向 量 。 

将 互 的 特征 值 从 大 到 小 排列 为 N 之 2 三 … 过 jy 三 SIC 相对 应 的 单位 特征 向 量 依次 为 Di ， 
U0,… ,D0,， 则 有 2U; 二 AiU;， 将 其 两 端 左 乘 以 UW 六 WUD; 二 1， 则 有 UTZU; 二 A.U7U; 二 和 二 
DCPD (=1,2,…,p)， 故 Pl 一 UTx 有 最 大 为 头 、 称 为 第 一 主 成 分 ，P 一 UTx 有 次 大 方差 ， 
称 为 第 二 主 成 分 ， 依 此 类 推 。 SA 

5 主 成 分 个 数 的 提取 、 > 2 

在 解决 实际 问题 时 ， 为 也 简化 问题 通常 不 是 提取 户 个 主 成 分 而 是 提取 9 (gp) 
个 主 成 分 就 够 了 。 抽取 记分 个 数 的 原则 是 这 《个 守成 分 能 够 反映 出 原来 p 个 变量 的 绝 大 
部 分 的 方差。 NV 


1) A pli 外/ 沁 

要 说 明 主 成 4 方差 贡献 率 ， 先 要 说 月 特征 值 2 的 意义 。2; 是 样本 观测 值 在 其 第 i 个 
主 成 分 上 的 方差 (分 散 程 度 )， 如 果 ) 的 值 很 小 ， 说 明 这 个 主 成 分 在 分 析 样 本 数据 时 所 起 
的 作用 不 大 ， 可 以 忽略 不 计 。 那 么 ， 小 到 什么 程度 才 认为 无 足 轻重 ， 可 以 忽略 呢 ? 为 此 引 
入 方差 贡献 率 。 


2 





E 
PDPp;) 
1 一 1 
分 的 方差 贡献 率 ， 它 反映 了 第 ;个 主 成 分 综合 原来 个 变量 信息 的 能 力 。 
2) 主 成 分 的 累积 方差 贡献 率 
前 g 个 主 成 分 共有 多 大 的 信息 综合 能 力 ， 用 这 g 个 主 成 分 的 方差 和 在 全 部 方差 中 所 占 


Ai 
第 i 个 主 成 分 的 方差 在 全 部 方差 中 所 占 的 比例 -了 CD [ 二 jos 个 主 成 


i 














Ppep) bp 

比例 二 即 来 描述 ， 称 为 前 g 个 主 成 分 的 累积 方差 贡献 率 。 
Ppp;) D3 
i=1 i=1 











3) 主 成 分 个 数 的 确定 
一 般 地 ,我 们 取 累 计 方差 贡献 率 达到 80% 以 上 的 前 g 个 主 成 分 就 可 以 了 . 因为 它们 已 
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经 代表 了 绝 大 部 分 的 信息 ; 也 可 以 根据 实际 情况 来 确定 主 成 分 个 数 。SPSS 中 选取 主 成 分 
的 方法 有 两 个 : 一 是 根据 特征 值 不 小 于 1 来 选取 ; 另 一 种 是 直接 规定 主 成 分 的 个 数 来 
选取 。 








8.1.2 主 成 分 分 析 的 步 又 及 应 用 


1. 主 成 分 分 析 的 步骤 
第 一 步 : 确定 分 析 变量 ， 收 集 数据 资料 。 


样本 数据 资料 矩阵 为 
11 Xz ” lp 
X= 全 四 et Tp < 
这 而 ， 立 Tnp XX\ 
第 二 步 : 对 原始 数据 进行 标准 化 。 2 


原始 数据 标准 化 是 为 了 消除 由 于 量 纲 的 不 下 :的 一 些 不 合理 的 影响 。 
(1) 计算 样本 数据 X 的 均值 和 协 方差 际 











均值 ， 
协 方差 阵 
5S = Ls Jy “pp) 
0 RS 
- he Gi=1,2,0 ,ph=1,2,.",n) 
第 三 步 : 对 标准 化 后 的 样本 数据 资料 计算 协 方差 阵 或 相关 阵 。 
(1) 协 方差 阵 
= [Ls]pxp 
(2) 相关 阵 : 
R=[7y jpxps = j=1,2,p) 
[rs Jpxp i p 
第 四 步 : 计算 或 R 的 特征 值 及 相应 的 特征 向 量 U;， 并 按 的 大 小 排序 (i 二 1， 
2,°%,p)。 


第 五 步 : 计算 主 成 分 的 贡献 率 及 累计 贡献 率 。 
(1) 贡献 率 : 
外 


Pp 
2 
i=l 





280 | 应 用 统计 学 (第 3 版 ) »》 


(2) 累计 贡献 率 : 





第 六 步 : 确定 主 成 分 个 数 。 

一 般 取 累计 贡献 率 不 小 于 80% 的 前 g 个 主 成 分 , 或 选用 特征 值 不 小 于 1 的 前 g 个 主 成 分 。 

第 七 步 : 将 样本 数据 代入 前 q 个 主 成 分 的 表达 式 ， 可 分 别 计算 出 各 单位 前 g 个 主 成 分 
的 得 分 。 有 了 主 成 分 的 得 分 值 ， 则 可 以 在 许多 分 析 中 使 用 这 些 主 成 分 ,进一步 做 综合 评 
估 、 聚 类 分 析 及 回归 分 析 。 


辐 风 国 回 网 的 














日 











XK 
主 成 分 的 计算 < 
需要 说 明 的 是 ， 从 协 方差 阵 和 相关 阵 计 算 主 成 分 一 般 是 不 人 变量 取 值 范围 彼此 相差 很 大 或 度量 


单位 不 同时 ， 可 以 考虑 标准 化 ， 以 便 使 计算 结果 有 合理 A 免 出 现 误解 。 当 没有 上 述 度量 单位 和 数 
量 级 的 差异 ， es ae nd 释 或 计算 方差 贡献 时 ， 一 般 不 会 矛盾 。 





(由 访 才 相 8- 二 科 - 


S72 
了 主 成 分 分 析 优 XX 


主 成 分 分 析 是 利用 陈 给 的 间 害 ， 在 损失 很 少 信 ee 综合 指标 的 多 元 统 
计 方法 。 通 常 把 转化 入 大 的 综合 指标 称 为 主 成 全 < 于 中 各个 主 成 分 可 是 原始 灾 量 的 线性 组 合 ， 且 各 个 主 
nn TR glo 

在 应 用 主 成 多 耸 条 解决 实际 问题 时 ， 主 成 分 分 析 体现 出 了 一 定 的 优点 但 也 存在 一 定 的 缺点 。 

主 成 分 分 析 的 优点 : 克服 了 多 重 共 线 性 问题 ; 抓 住 了 分 析 问 题 的 主要 填 盾 ， 简化 了 计算 过 程 ; 是 一 
种 实用 、 有 效 的 分 析 方法 。 

主 成 分 分 析 的 缺点 : 

问题 一 传统 主 成 分 分 析 进 行 无 量 网 化 处 理 的 方法 是 “中 心 标准 化 ” 方法 ， 即 把 原始 数据 的 各 指标 
均值 化 为 0， 方差 化 为 1， 进 而 由 计算 原始 数据 的 协 方差 阵 转化 为 直接 计算 原始 数据 的 相关 系数 径 阵 来 求 
主 成 分 。 但 这 一 方法 用 于 主 成 分 分 析 是 不 合适 的 ， 因 为 原始 数据 包含 两 部 分 信息 。 一 部 分 是 各 指标 变异 
程度 的 差异 信息 ， 由 各 指标 的 方差 大 小 来 反映 ， 另 一 部 分 是 各 指标 问 相互 影响 程度 上 的 相关 信息 ， 由 相 
关系 数 来 体现 . “中心 标准 化 ”方法 虽然 达到 了 消除 量 纲 和 数量 级 影响 的 目的 ， 但 是 该 方法 把 各 指标 的 方 
差 化 为 1， 这 也 就 消除 了 各 指标 差异 程度 上 的 差异 ， 进 而 从 丢失 一 部 分 信息 的 数据 ( 即 标准 化 数据 ) 中 
提取 主 成 分 显然 是 不 可 取 的 。 

问题 二 ， 传统 主 成 分 分 析 有 一 个 最 显著 地 特点 ， 即 它 是 一 种 线性 降 维 技术 ， 表 现 为 其 

国 ji 国 。 主 上 分 是 原 妆 普 的 级 性 姐 合 。 而 在 实际 应 用 站， 各 指标 加 有 时 在 丰 此 线性 关系 ， 主 成 分 

| 与 原始 数据 之 间 也 时 现 非 线性 关系 。 这 说 明 如 果 用 传统 主 成 分 分 析 简 单 地 处 理 非 线性 数据 

| 











么 降 维 效果 就 不 是 很 明显 ， 必 然 会 导致 分 析 评 价 结果 与 事实 偏差 很 大 ， 因 此 ， 有 必要 对 
传统 主 成 分 分 析 进 行 改 造 ， 使 其 适用 于 非 线性 数据 . 
【期 刊 推荐 】 针对 上 述 的 问题 ， 有 关 文 就 提出 了 相应 的 改进 方法 。 


第 Q 诗 
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2. 主 成 分 分 析 的 应 用 


【 例 8.1】 对 导入 案例 8 - 1 进行 主 成 分 分 析 。 

某 地 区 为 了 对 14 家 工业 企业 进行 经 济 效益 的 综合 评估 ,选择 了 8 项 不 同 的 利润 指标 ， 
包括 净 产 值 利 润 率 X1(%)、 固 定 资产 利润 率 Xs,(%)、 总 产值 利润 率 XX;(%)、 销 售 收入 
利润 率 X41(%)、 产 品 成 本 利润 率 X;(%)、 物 耗 利润 率 Xs (%)、 人 均 利润 率 Xr(%)、 流 
动 资金 利润 率 Xs(%)。 统 计数 据 资料 如 表 8- 1 所 示 。 试 进行 主 成 分 分 析 。 























表 8-1 14 家 工业 企业 利润 指标 的 统计 数据 


















































解 : (1) 计算 相关 系数 和 矩阵， 如 表 8 -2 所 示 。 
表 8-2 相关 系数 矩阵 


















































Xi Xs Xs X Xs 
Xl 1.000 
X2 0.763 1.000 
Xa 0.708 0.553 1.000 
Xs 0.643 0.514 0. 988 1. 000 
Xs 0.596 0.515 0.978 0. 981 1. 000 
X6 0. 544 0. 469 0. 974 0. 980 0. 992 1. 000 
X7 0. 622 0.736 0. 683 0. 697 0. 627 0.630 1.000 
Xs 0.773 0.712 0.780 0.733 0.787 0.724 0. 622 1. 000 
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(2) 计算 相关 系数 矩阵 的 特征 值 和 相应 的 单位 正 交 化 特征 向 量 ， 如 表 8 -3 和 表 8 一 4 






























































所 示 。 
表 8-3 相关 系数 矩阵 的 特征 值 及 贡献 率 
主 成 分 特 征 值 贡献 率 /% 累计 贡献 率 /% 
1 6. 13662 76. 708 76. 708 
2 1.04213 13. 027 89.734 
3 0.43595 5.449 95. 184 
4 0. 22037 2.755 97. 938 
5 0. 15191 1. 899 99. 837 
6 0. 00883 0.110 2 险 99. 948 
也 0. 00296 0.037 AN 99. 985 
8 0.00122 0.016 全 、 100. 000 
表 8-4 对 应 于 而 向 量 
主 成 分 蕊 Us 
TE A 1132 0. 415105 
SA -十 
2 5 0. 296164 > 0. 597663 
区 和 | 
3 2 KK 0. 389120 vy 7 一 0. 229744 
We 
4 和 0.3847247 pA —0. 278693 
了 0 W955, 一 0.316317 
一 SA 二 
久 ， 0-379867 一 0. 371505 
7 55 0. 278145 
8 0. 156836 











由 表 8-3 可 知 ， 前 两 个 主 成 分 的 累计 贡献 率 已 经 达到 89.734%， 故 只 需 提取 前 两 个 


主 成 分 即 可 。 
(3) 计算 主 成 分 得 分 。 
前 两 个 主 成 分 函数 为 


Pi =0. 321132X1 十 0.296164X2 十 0. 389120Xs 十 0.384724X4 十 0.379551Xs 十 


0.370867Xs 十 0. 319955X7 十 0. 355461Xs 


了 一 0. 415105X1 十 0. 597663Xa 一 0. 229744Xs 一 0. 278693X4 一 0. 316317Xs 一 








0. 371505X6 十 0.278145X7 十 0. 156836Xs 


第 一 主 成 分 Pi 在 8 个 指标 的 系数 近似 相等 ， 它 是 综合 反映 了 各 工业 企业 的 总 经 济 效 





益 ， 其 贡献 率 高 达 76.71%。 因 此 可 以 根据 第 一 主 成 分 Pi 的 值 对 各 工业 企 + 

















此 进行 综合 评 


佑 。 将 标准 化 后 的 数据 资料 代入 到 主 成 分 函数 中 . 即 可 计算 出 主 成 分 得 分 ， 如 表 8 -5 


所 示 。 
























































主 成 分 与 因子 分 析 
表 8-5 按 第 一 主 成 分 得 分 排序 
排 名 书 值 企业 序号 
1 5. 22385 9 
2 3.45780 6 
3 1.06472 2 
4 1.01116 8 
5 0.73165 1 
6 0. 39917 13 
7 0. 36440 14 
8 0. 06679 本 从 5 
9 一 0.27669 < 7 
10 一 0.30203 2 10 
11 一 2. 18861 区 4 
12 一 2.37005 _ < 11 
13 -2 826K RY 3 














i 分 
OO OO OA 


~. 


5 | 二 小 分 分 析 不 要 来 数据 来 自 正太 总 人 


ww 方差 阵 出 发 求解 主 成 仿 %J 诺 加 从 相关 阵 求解 主 成 分 ， 均 没有 涉及 总 体 分 布 问题 。 


也 就 是 说 ， 与 代入 筑 计 方法 不 同 ， 主 成 分 分 煌 不 要 求 数据 来 自 正 态 总 体 。 主 成 分 分 析 就 是 对 和 矩阵 结 
构 的 分 析 。 对 多 震 随 机 变量 而 言 ， 其 协 方差 隆 或 其 相关 阵 都 是 非 负 定 的 ， 这 样 就 可 以 按照 求解 主 成 分 的 
步 又 求 出 其 特征 值 、 标 准 正 交 特 征 向 量 ， 进 而 求 出 主 成 分 ， 达 到 缩减 数据 维 数 的 目的 。 

主 成 分 分 析 的 这 一 特性 大 大 扩展 了 其 应 用 范围 ， 对 多 维 数据 ， 只 要 是 涉及 降 维 的 处 理 ， 我 们 都 可 以 
尝试 用 主 成 分 分 析 ， 而 不 用 花 太 多 精力 考虑 其 分 布 情况 








8.2.1 因子 分 析 的 数学 模型 


1. 因子 分 析 的 含义 


因子 分 析 是 主 成 分 分 析 的 推广 ， 它 也 是 将 具有 错综复杂 关系 的 变量 〈 指 标 ) 综合 为 数 
量 较 少 的 几 个 综合 变量 〈 称 为 因子 )， 以 再 现 原始 变量 与 因子 之 间 的 相互 关系 。 换 言 之 ， 
因子 分 析 就 是 探讨 存在 相关 关系 的 变量 之 间 ， 是 否 存在 不 能 直接 观测 到 但 对 可 观测 指标 的 
变化 起 支配 作用 的 潜在 因子 (Factor) 的 分 析 方 法 。 
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2. 因子 分 析 的 基本 原理 
对 于 多 变量 问题 .形成 的 背景 原因 是 各 种 各 样 的 ， 其 共同 原因 称 为 公共 因子 ; 每 一 
原始 变量 又 有 其 特定 的 原因 ， 称 为 特殊 因子 。 因 子 分 析 就 是 由 样本 的 数据 资料 将 每 一 
始 变 量 用 起 支配 作用 的 公共 因子 与 特殊 因子 的 线性 函数 来 表达 ， 以 便 达 到 合适 地 解释 原始 
指标 的 相关 性 并 降低 其 维 数 。 一 般 使 公共 因子 尽 可 能 少 ， 且 在 专业 上 有 意义 ,公共 因子 共 
同 作用 于 各 个 变量 ， 特 殊 因子 仅仅 作用 于 对 应 的 那个 变量 。 
例如 ， 某 公司 招聘 人 才 ， 对 每 位 应 聘 者 进行 外 貌 、 求 职 信 的 形式 、 专 业 能 力 、 讨 人 喜 
欢 的 能 力 、 自 信心 、 洞 察 力 、 诚 实 、 推 销 本 领 、 经 验 、 积 极 性 、 抱 负 、 理 解 能 力 、 潜 在 能 
力 、 实 际 能 力 、 适 应 性 等 15 个 方面 的 考核 。 这 15 个 方面 可 归结 为 应 聘 者 的 外 圳 能力、 讨 
人 喜欢 的 能 力 、 经 验 、 专 业 能 力 4 个 方面 ， 每 一 方面 称 之 为 一 个 公共 因子 。 企 业 可 根据 这 
4 个 公共 因子 的 情况 来 衡量 应 聘 者 的 综合 水 平 。 这 4 个 公共 因子 以 表示 为 
Xi=anFitaw Fs tansFs taaF tte, (el, s ES (8—6) 
称 已 、Fs 、Fs 、F 是 不 可 观测 的 潜在 因子 ， 即 公 A 15 个 变量 共享 这 4 个 公共 因 
子 ， ran 即 不 被 包含 的 特 RE 














































































回 杂品 回 因子 分 析 的 基本 思想 就 是 i 过 瓯 斌 的 相关 系数 算 阵 内 部 纪 者 构 的 研究 ， 找 
出 能 控制 所 有 训 芥 的 少数 办 个 和 $ 因 子 去 描述 多 个 变 基 之 间 的 相关 关系 ， 然 
后 根据 相关 性 的 大 小 .把 变 放 分组、 使 得 同 组 内 的 变量 之 间 相 关 性 较 高 ， 但 不 
【研究 课 是 了 同 组 的 变 基 相关 性 图 依 。、， xx 
3 因子 分 析 的 数学 模型 2 人 v KT 
假设 及 个 样品 ， fi i bp 项 变量 ( 指 指标 ); 记 为 Xi ,X: ,…,X, ， 原 始 数据 资 
料 阵 2 > 
ND oa 
X T21 Taz “” 2p 
X=| . . |=CX1,X Xp) 
Tl Ns Tp 
则 因子 分 析 的 一 般 数 学 模型 为 
Xi1=aunFi+arz Ft+amF, +el 
X2 一 alFI 十 azz Fo 十 … 十 aamFw 十 es 
(8-7) 
Xp=an Fitap Fs tapm Fn te, 
简 记 为 
X=AF+e (8 = 











式 中 ,，F 一 (Fi .F2 ,…,Fw)T 为 公共 因子 .其 系数 4 一 [ai ](i 二 1,2,…,p;j 二 1,2,…,m) 称 
为 载荷 矩阵 ，o 为 第 :个 变量 在 第 7 个 公共 因子 上 的 载荷 ， 简 称 因 子 载荷 ， 是 不 可 观测 的 
潜在 因子 。s 一 (el ,ee ,…:en)7T 是 特殊 因子 ,是 不 能 被 前 m 个 公共 因子 包含 的 部 分 。 

因子 分 析 的 数学 模型 满足 如 下 的 条 件 : 














第 8 章 
主 成 分 与 因子 分 析 














(1) ms<p。 

(2) 假定 特殊 因子 6; 服从 N(0,02) (i==1.2,…,p)。 

(3) 与 F 不 相关 ，F; 与 Fj(i 关 j) 不 相关 。 

(4) 假定 原始 变量 、 公 共 因子 和 特殊 因子 都 已 标准 化 ， 即 均值 为 0, 方差 为 1。 


您 阅读 案例 8 一! 


C. 斯 皮尔 曼 因 子 分 析 案 例 


1904 年 ，C, 斯 皮尔 曼 发 表 了 对 学 生 考试 成 绩 分 析 的 著名 文章 ， 可 认为 是 因子 分 析 (Factor Analy- 
sis) 的 开始 。 因 子 分 析 模 型 是 主 成 分 分 析 的 推广 。 ee 由 研究 原始 变量 相关 短 阵 内 
部 的 依赖 关系 出 发 ， 把 一 些 具有 错综复杂 关系 的 变量 归结 为 少数 几 个 综 1 种 多 变量 统计 分 析 方 
法 。C, 斯 皮尔 曼 在 该 例 中 研究 了 33 名 学 生 在 古典 语 〈C)、 法 语 《了 )e 2 数学 (M) 、 判 别 
(D) 和 音乐 (Mu) 6 门 科目 考试 成 绩 之 间 的 相关 性 ， Te 


C F E 
1.00 0.83 0.78 Cv 


C 0.63 
F |o0.83 1.00 0.65 0.57 
E |o0.78 0.67 SA r64 0.54 0.51 
M | o.70 We 1.00 0.45 0.51 
D | 0.66 0.45 1.00.. 0.40 
Mu 0.64 SN、 0.51 0.51 0M0N ,00 


c. 其 皮尔 遇 注 六 到 上 面相 关 疾 健生 个 有 起 的 规律 ， A 任意 两 列 的 元 素 


大 致 成 比例 ， 对 C > 
0.83、0.70 si 机 
0.67™0. 64 fo 54S0.51 人 1 2 


ee core 从 下 形式 ， Xi 一 aiF 十 ai ， 式 中 ，X 为 第 i 门 科目 标准 

后 的 考试 成 绩 ,) 娘 秆 为 0， 方差 为 1; 下 为 公共 因子 ， 对 各 科 考 试 成 绩 均 有 影响 ， 也 是 均值 为 0， 方差 
Pr ns 下 与 ci 相互 独立 。 也 就 是 说 ， 每 一 门 科目 的 考试 
成 绩 都 可 以 看 做 是 由 一 个 公共 因子 (可 以 认为 是 一 般 智 力 ) 与 一 个 特殊 因子 的 和 。 在 满足 以 上 假定 的 条 
件 下 ， 就 有 





Cov(Xi, Xj)=E(aF te) CaF +e) =aa), VarF=aiaj 
于 是 ， 有 

CovCX Xi) a 

CovCX Xe) ax 


此 结果 与 之 无 关 ， 与 在 相关 矩阵 中 所 观察 到 的 比例 关系 相 一 致 。 
资料 来 源 : 何 晓 群 .多 元 统计 分 析 [Mj. 北京 中 国人 民 大 学 出 版 社 ，2009. 


8.2.2 因子 载荷 


1. 因子 载荷 答 阵 中 的 几 个 统计 特征 


1) 因子 载荷 or 的 统计 意义 
将 因子 分 析 模 型 (8 -7) 简写 为 
Xi=anFitazF2t.…+amFnte (i=1,.…,m) (8—9) 
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在 上 式 的 两 边 右 乘 以 F;， 再 求 数学 期 望 ， 得 
E(XiFj)=anE(FIF) + HayE (FFP) + +awE(F,F))+ECeF;) (8-10) 
由 于 在 标准 化 下 ， 原 始 指标 X、 公 共 因 子 下 和 特殊 因子 s 都 已 标准 化 ， 即 均值 为 0， 
方差 为 1， 而 且 各 因子 不 相关 ， 因此， 有 
Var, 一 CiarPiF 十 aizrF 下 二 trerp, = C8:=11> 
由 公式 (8-11) 可 知 ， 因 子 载荷 uj 是 变量 X, 与 公共 因子 Fi 的 相关 系数 〈 即 载荷 矩 
阵 中 第 i 行 第 j 列 的 元 素 )， 反映 了 变量 X; 与 公共 因子 F; 的 相关 程度 。|ai | 三 1， 绝 对 值 
越 接 近 于 1， 表明 公共 因子 Fj 与 变量 X; 的 相关 性 越 强 。 同 时 因子 载荷 aj 也 反映 了 公共 因 
子 Fj 对 原始 变量 义 ; 的 重要 作用 和 程度 。 
2) 变量 共同 度 的 统计 意义 _ 
变量 X; 的 共同 度 也 就 是 变量 X; 的 方差 ， 它 是 因 TA i 行 的 元 素 的 平方 
和 ， 记 为 :XK 
,Ss «\ 
h? = Pe (i= sy C0.=10y 
若 将 因子 分 析 模 型 Xi; 二 ai 让 i 十 … 十 qm 了 十 ;两边 要 
D(X;)=ah D(F1)’ MSD Fs) + De (8-13) 
由 于 X; 和 正 已 标准 化 ， 所 以 有 AAA 


和 N i 2 一 
了 ,SY 之 人 + 站 (8-14) 

由 公式 (8- 14) 可 知 ， 康 婚变 最 的 方差 可 由 两 部 从 解释。 第 一 部 分 是 变量 共同 度 情 ， 
是 全 部 公共 因子 对 变量 六 的 总 方差 的 贡献 ， 体 现 了 多 部 公共 因子 对 变量 X 的 解释 贡献 各 
度 。 若 忆 接近 于 交 pe 信息 都 被 所 选取 的 公共 因子 说 明了 。 例 
如 ， et 即 指标 X; 的 95 色 的 信息 量 被 全 部 公共 因子 说 明 。 第 二 部 分 是 
特殊 因子 的 方差 sz， 仅 与 变量 X; 本 身 的 变化 有 关 ， 它 反映 了 变量 X; 的 方差 中 不 能 由 全 体 
公共 因子 解释 说 明 的 比例 ，e? 越 小 ， 说 明 变量 X; 的 信息 损失 越 少 。 

3) 公共 因子 方差 贡献 的 统计 意义 

公共 因子 F; 的 方差 贡献 是 因子 载 共 乱 阵 中 各 列 元 素 的 平方 和 。 记 为 






























































p 
S; = Da3 (8—15) 


Sn} 

N 共 因子 FF; 的 方差 贡献 反映 了 公共 因子 FF; 对 原始 变量 的 解释 能 力 。 该 值 越 高 ， 说 明 
相应 公共 因子 的 重要 性 越 高 。 

2. 因子 载荷 矩阵 的 估计 方法 

要 建立 实际 问题 的 因子 分 析 模 型 ， 关 键 要 根据 样本 数据 估计 因子 载荷 矩阵 4， 对 4 的 
估计 方法 很 多 ， 如 主 成 分 分 析 法 、 最 大 似 然 法 、 主 轴 因 子 法 、 最 小 二 乘法 和 广义 最 小 二 乘 
法 等 。 其 中 目前 较为 普遍 使 用 的 是 主 成 分 分 析 法 ， 下 面 重点 介绍 其 估计 原理 。 
用 主 成 分 方法 确定 因子 载荷 ， 是 在 进行 因子 分 析 之 前 先 对 数据 进行 一 次 主 成 分 分 析 ， 
然后 把 前 面 几 个 主 成 分 作为 初始 公共 因子 ， 具 体 方法 如 下 : 

设 主 成 分 分 析 的 数学 模型 为 


~ 
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Pi=un X1+uiz XtuipXp=uX (i=1,2,..…,p) 
首先 计算 样本 协 方差 阵 S， 并 求 $ 的 特征 值 41 三 Xz 三 … 宇 4 记 0 及 对 应 的 单位 正 交 特 征 向 
量 届 ,wz，… ,up; 然后 计算 Pi 二 uJX 得 到 各 个 主 成 分 。 
由 于 因子 分 析 的 目的 是 减少 变量 个 数 ， 因 此 公共 因子 个 数 一 般 应 小 于 变量 个 数 ( 即 
mm 三 p)， 此 时 最 后 mn 一 p 个 特征 值 应 较 小 ， 通常 可 略 去 其 对 $S 的 贡献 。 根 据 线性 代数 知识 ， 
S 可 分 解 为 

















这 Ro 
S= DumuT =( A i sd ee Wi ) : (8-16) 
i=1 a 
当 略 去 特殊 因子 时 ， 因 子 分 析 模 型 变 为 
X=AF ge 1 
则 SR 
DW)=D(AF)=AD(F)AT =AAY 
NUL VA ul 
SAAT=( VA ul :UN 《8—17) 
AN Wu 





RN 

所 以 因子 载荷 矩阵 4 的 第 j 列 应 为 VA 纪 ， 即 载荷 矩阵 .4 样本 估计 量 为 

SA RY 入 (8-18) 
当 相关 变量 所 取 单 位 下 同时， 我 们 常常 先 对 变 时 标准化， 标准 化 样本 协 方差 隆 8 就 是 

原始 变量 的 样本 相关 阵 R， 再 用 R 代替 S,. 与 > 似 ， 进 行 载荷 矩阵 的 估计 。 

实际 应 用 和 通常 根据 公共 央 子 的 累积 责 献 率 达 到 80% 以 上 ,决定 所 取 公 共 因 子 的 

1 数 。 入 | 


8.2.3 因子 旋转 与 因子 得 分 








1. 因子 旋转 

因子 分 析 的 目的 不 是 要 找 出 公共 因子 ， 而 是 应 该 知道 每 个 公共 因子 的 实际 意义 〈 即 命 
名 解释 )， 以 便 对 实际 问题 进行 科学 的 分 析 。 观 察 因 子 载荷 矩阵 ， 如 果 因 子 载荷 aj 的 绝对 
值 在 第 7 列 的 多 个 行 上 都 有 较 大 的 取 值 ， 说 明 公 共 因 子 f; 同时 解释 许多 指标 的 信息 ， 且 
对 每 个 变量 Xi; 只 能 解释 其 中 较 少 部 分 的 信息 。 这 时 ,因子 f; 不 能 典型 代表 任何 一 个 原始 
指标 Xi， 它 的 实际 意义 是 模糊 不 清 的 。 为 解决 这 个 问题 ， 由 因子 载荷 阵 的 不 唯一 性 ， 可 
以 对 其 进行 旋转 ， 使 每 个 变量 只 在 一 个 公共 因子 上 有 较 大 的 载荷 ， 而 在 其 余 公 共 因 子 上 的 
载荷 比较 小 。 因 子 旋转 有 方差 最 大 正 交 旋转 法 、 正 交 旋 转 法 和 和 斜 交 旋转 法 ， 本 书 只 介绍 方 
差 最 大 正 交 旋 转 法 。 

方差 最 大 正 交 旋转 法 是 从 初始 因子 载荷 矩阵 的 每 一 列 出 发 ， 使 和 每 个 因子 有 关 的 载荷 
的 平方 的 方差 最 大 。 

先 考 虑 两 个 因子 的 平面 正 交 旋转 ， 设 因子 的 载荷 算 阵 为 
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all al 
azl a2z2 
及 三 | 。 
apl ap2 
则 因子 分 析 模 型 为 
X1=aunFitarzF: 
KX: =azFl+azz Fz 
Xp =ap Fi tape Fs 
设 旋转 矩阵 为 


{cosp 一 sinp A 
re cosgp | 2 人 险 
& 


n=Ar=4 sg 次- 
sing COs' XU 
有 一 NSi 
QllcosP 十 al2sin sinp 十 alzcosyp 


NS 。 
aplcosg :Xs 一 aplSinp 
hm > 

二 | 
WA > bp2 


四 站 
方差 最 大 正 交 旋 转 法 目的 是 天 通过 因 朱 入 和 后， 使 每 个 因子 上 的 载荷 尽量 拉 开 距 
离 ， 一 部 分 的 载荷 趋 于 +1， 另 一 部 分 趋 条 0 这 实际 上 希望 将 指标 XI , Xs,…,X, 分 成 两 
部 分 ,一 部 分 主要 与 第 一 公共 因子 有 关 ， 另 二 部 分 主要 与 第 二 公共 因子 有 关 ， 这 也 就 是 要 
求 (0% 631) 和 (bi ,0 02) 两 组 数据 的 方差 Vi 和 Vs 尽 可 能 地 大 。 即 正 交 
旋转 的 角度 p 必须 满足 使 
2 1 p 所 1 p 所 发 
V=Vi+V, 壮 [ 寺 立 作 】 (3 各) ] 


《8=19) 





















ph 
达到 最 大 值 。 这 里 取 外 是 为 了 消除 符号 不 同 的 影响 ， 除 以 让 是 为 了 消除 各 个 变量 对 共 因 
子 依赖 程度 不 同 的 影响 。 


邻 入 0, 则 有 
dp 














__D—24AB/P 
tan49 一 5 一 (2 一 82) 7 万 (8—20) 
式 中 
p p 户 p 
A= Du B= Dv C= Dv?) D= 2 uw 
| = i=1 i=1 
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如 果 公 共 因 子 有 六 (mw 之 2) 个 ， 则 需 逐 次 取 2 个 公共 因子 全 部 配对 进行 上 述 的 旋转 ， 
共 需 旋转 C2 次 算 作 一 个 循环 ， 如 循环 完毕 得 出 的 因子 载荷 矩阵 还 没有 达到 目的 ， 则 可 以 
进行 第 二 轮 C3 次 配对 旋转 ， 依 次 进行 直到 达到 实际 要 求 为 止 。 

2. 因子 得 分 

因子 分 析 是 将 变量 表示 为 公共 因子 的 线性 组 合 。 如 果 我 们 要 使 用 这 些 公共 因子 做 其 他 
的 研究 ， 例 如 ， 把 得 到 的 公共 因子 作为 自 变量 来 做 回归 分 析 ， 对 样本 进行 分 类 或 评价 ， 这 
就 需要 我 们 对 公共 因子 进行 测度 ， 即 给 出 公共 因子 的 值 。 因 此 ， 需 要 反 过 来 将 公共 因子 表 
示 为 变量 的 线性 组 合 。 

设 公共 因子 由 原始 变量 表示 的 线性 组 

Fj;=Bi Xi TB Xj=1 ) 二 (8-21) 

称 公式 (8 -21) 式 为 因子 得 分 函数 。 由 于 方程 的 个 数 少 于 变量 的 扑 数 《 即 二)， 

所 以 内 能 在 最 小 二 乘 意 义 下 对 因子 得 分 本 数 的 系数 进 各 生计。 设 公共 因子 可 以 对 /个 
变量 做 回归 ， 即 建立 回归 方程 为 ,站 

Tn) 























B=bn Xt tb XN 
由 于 变量 和 公共 因子 均 已 标准 化 故 有 byo 二 0 -二 让 小 二 和 估计 有 
Mx (8—23) 
Po NAN 
式 中 ， 下 一 (有 Pa DOT; XV) R 始 变量 的 相关 系数 矩阵 。 
1 < x RR 


CE LL $l 


2 人 | 因子 提取 准则 
eee empire le ln 但 是 因为 因子 数量 应 该 小 于 变量 


(8—22) 





te 





4 














数量 ， 因 此 必须 顽 估 Y 站 读 提 取 儿 少 个 因子 《因子 数 短 < 严重 数量 )。 下 面 是 可 供 选择 的 因子 提取 准则 。 
在 文献 中 建议 的 因子 数量 确定 的 准则 在 SPSS 中 被 实现 的 选择 

直到 X% (一 般 为 95%) 的 方差 被 可 以 事先 确定 。 

ee 仅 提取 特征 值 大 于 1 的 因子 《Kaiser | 如 果 没 有 别 的 说 明 ， 由 计算 机 自动 使 用 。 
(03) 提取 a (如 3) 个 因子 。 数量 可 以 由 “抽取 ”对 话 框 中 的 “因子 数 ” 给 出 。 





(4) Scree -检验 。 将 因子 按 其 特征 值 降序 
排列 ,将 具有 最 小 特征 的 因子 连 成 一 条 直线 ， 在 “抽取 ”对 话 框 中 同样 被 要 求 必要 的 Screeplot。 
直线 的 最 后 一 点 决定 了 因子 的 数量 。 








如 果 因 子 数 分 析 前 可 以 被 确定 ,那么 “抽取 ”对 话 
框 中 提取 因子 的 数量 不 小 于 变量 数量 的 一 半 。 


(6) 提取 所 有 旋转 后 可 被 解释 的 因子 根据 希望 的 旋转 原则 事先 确定 


(5) 因子 的 数量 应 该 小 于 变量 的 数量 。 
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8.2.4 ”因子 分 析 的 步 又 及 应 用 


1. 因子 分 析 的 步骤 


第 一 步 : 确定 分 析 变量 ， 收 集 数 据 资 料 。 
第 二 步 : 对 原始 数据 进行 标准 化 。 
第 三 步 : 计算 所 选 变量 的 相关 系数 矩阵 。 
子 分 析 的 前 提 条 件 是 观测 变量 问 有 较 强 的 相关 性 ， 而 相关 系数 矩阵 描述 了 原始 变量 
之 间 的 相关 关系 。 通 过 这 种 方法 可 以 判断 所 选 变量 是 否 适宜 做 因子 分 析 。 

第 四 步 : 提取 公共 因子 。 

采用 某 种 方法 计算 初始 载荷 矩阵 ， 对 主 成 分 方法 而 言 ， 就 是 通过 资料 矩阵 的 相关 系数 
和 矩阵 计算 特征 值 和 特征 向 量 。 要 确定 提取 公共 因子 的 个 数 ， 可 以 据 研 究 者 的 设计 方案 或 
有 关 的 经 验 事 先 确定 ; ed 六 二 般 认 为 要 达到 80% 才 能 符 
合 要 求 ; as AT A 人 为 方差 小 于 1 的 因子 其 贡 
献 可 能 很 小 。 x 

第 五 步 ， 因子 旋转 。 

若 公 共 因 子 的 实际 含义 不 清 ， ga > 因此 需要 通过 坐标 变换 使 每 个 
原始 变量 在 尽 可 能 少 的 公共 因子 之 间 多 妇 的 关系 ， 这 样 公共 因子 的 实际 意义 更 容易 解 






































国 丰产 加 。 释 ， 并 使 公共 因子 基 在 俞 儿 解释 性 。 2 

兴 第 六 步 ， 计 得 公 并 因子 得 分 。 2 

下 求 出 各 样 来 的 公共 因子 得 分 ， A 则 可 以 在 许多 分 析 
Co 和音 夯 】 中 使 用 这 些 闫 共 因子 ， 进 一 上 和 全 人 、 聚 类 分 析 及 回归 分 析 。 


Se: TT DS 


如 何 衡量 地 区 经 济 发 展 


重庆 是 一 个 新 兴 直 辖 市 ， 三 峡 库 区 建设 和 西部 大 开发 使 重庆 得 到 了 千 载 难 送 的 发 展 机 过 。 但 由 于 历史 
原因 ， 重 庆 地 方 经 济 发 展 极 不 平衡 ， 地 区 差异 明显 ， 是 大 城市 带动 大 农村 的 格局 ， 属 于 典型 的 二 元 经 济 结 
构 。 在 重庆 经 济 的 发 展 战略 中 ,怎样 对 自身 的 经 济 发 展 状况 评价 ， 协 调 内 部 的 经 济 结构 ， 找 到 拉动 经 济 的 
“增长 极 ”"， 则 是 实现 重庆 经 济 崛起 ， 将 重庆 建设 成 为 长 江 中 上 游 中 心 城市 战略 目标 的 基础 和 前 提 。 

在 衡量 一 个 地 区 的 经 济 发 展 状况 时 ， 并 不 能 仅仅 简单 比较 一 两 项 指标 数据 ， 而 是 应 该 从 社会 经 济 发 
展 的 各 方面 综合 考察 ， 从 而 描述 社会 经 济 的 现状 ， 找 出 存在 的 问题 及 影响 因素 ,为 地 区 经 济 发 展 提供 政 
策 制 定 依据 。 应 用 因子 分 析 综合 评价 方法 ， 选 取 能 够 反映 经 济 发 展 总 体 水 平 的 12 项 主要 指标 对 重庆 市 
40 个 区 县 的 经 济 情况 进行 分 析 。 结 果 显 示 : 渝中 区 和 九龙 坡 区 属于 第 一 类 地 区 ; 第 二 类 地 区 包括 渝 北 
区 、 江 北 区 、 沙 坪 坝 区 和 南岸 区 ， 这 6 个 地 区 是 重庆 市 增长 的 核心 区 域 ; 第 三 类 地 区 由 8 个 区 县 组 成 
它们 是 巴 南 区 、 北 碚 区 和 正在 大 力 调整 产业 结构 。 转 变 经 济 发 展 方式 的 大 渡口 区 ， 渝 东北 册 地 区 的 中 心 城 
市 万 州 区 ， 以 及 一 小 时 经 济 圈 的 涪陵 区 、 永 州 区 、 江 津 区 和 长 寿 区 ; 剩 下 区 县 就 归 为 第 四 类 地 区 ， 其 包括 
了 渝 东南 所 有 区 县 ， 渝 东 除 万 州 区 以 外 的 其 他 区 县 ,以 及 一 小 时 经 济 圈 的 十 个 不 属于 前 三 类 地 区 的 区 县 。 

该 综合 评价 提供 了 一 个 重庆 市 总 体 的 经 济 发 展 思路 。 如 果 把 第 一 类 地 区 和 第 二 类 地 区 归 为 发 达 地 区 
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的 话 ， 这 三 类 地 区 的 数量 比 为 6: 8: 26。 在 当前 中 国 经 济 不 平衡 协同 发 展 趋势 下 ， 可 以 分 阶段 、 有 侧重 
点 地 总 体 规划 重庆 市 各 个 区 县 在 新 一 轮 西部 大 开发 中 的 发 展 。 第 一 阶段 ，6 个 经 济 发 达 地 区 侧重 带动 8 
个 欠 发 达 地 区 的 经 济 发 展 ， 并 保持 或 缩小 落后 地 区 与 欠 发 达 地 区 的 差距 ; 第 二 阶段 : 8 个 欠 发 达 地 区 依 
次 达到 发 达 地 区 水 平 ， 同时， 有 部 分 落后 地 区 相继 发 展 欠 发 达 地 区 ,落后 地 区 的 数量 降低 为 相对 少数 ; 
第 三 阶段 ; 进一步 扩大 发 达 地 区 和 欠 发 达 地 区 的 数量 ， 争 取 全 面 消灭 落后 地 区 。 
资料 来 源 : 徐 科 ， 张 艳 . 重庆 各 区 县 经 济 发 展 水 平 的 因子 分 析 [J]. 重庆 工商 大 学 学 报 : 自然 科学 
版 ，2012，29(1) :42 一 48. 
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2. 因子 分 析 的 应 用 


【 例 8.2】 对 导入 案例 8 - 2 进行 因子 分 析 。 

为 了 考察 不 同 课程 对 学 生 知识 能 力 的 影响 ， 从 高 中 一 年 级 随机 抽取 了 15 名 学 生 ， 选 
拌 了 8 门 课程 的 期 末 考 试 成 绩 ， 即 历史 成 绩 Xi 、 化 学 成 绩 X 语文 成 绩 Xs、 英 语 成 绩 
Xi 、 地 理 成 绩 X; 、 物 理 成 绩 Xs 、 几 何 成 绩 Xi 、 代数 成 绕 关 k< 据 资 料 如 表 8 - 6 所 示 ， 
试 对 这 8 项 指标 进行 因子 分 析 。 


表 8-6 15 名 学 生 的 











































































































序号 XxX xX: Xs xX Xs Xs X7 Xs 
1 80 65 Bi | 和 80 78 83 94 
2 75 73 
3 55 52 
4 45 50 
5 85 68 
6 67 67 
7 56 55 
8 84 70 
9 82 88 
10 60 40 
11 82 72 82 80 60 85 65 75 
12 80 90 82 82 85 90 86 88 
13 85 70 90 75 70 70 86 72 
14 80 60 62 65 50 60 60 65 
15 82 88 65 82 70 75 86 96 
解 : (1) 对 原始 数据 进行 标准 化 ， 如 表 8 -7 所 示 。 
表 8-7 15 名 学 生 的 期 末 考 试 成 绩 的 标准 化 数据 
序号 XI Xs Xs Xs Xs 于 30 Xs 
1 |—.03922 |—1.26215| 一 .28100 | 1.25192 | .53910 | .80640 | 1.43999 | .44875 
2 |—1.13188| —.51087|—.28100| .11611 | .79180 | .23718 | .16941 | 一 .63694 
3 |—.87973 |—2.01344| .95871 | 一 1.77691| 一 1. 10347| 一 1. 18588| 一 1. 10117| —1.72262 
4 一 03922 .95871 .26250 | .72442 1. 89740 1. 22218 .44875 
5 一 :20733 一 1. 52071 | 一 1.77691| .16005 .94870 ls 一 .63694 
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( 续 ) 
序号 Xl 2 Xs Xs xX Xs XI Xs 
6 一 .29138 .36062 .90086 .11106 .21901 .33205 .19361 | 一 . 63694 
7 .80128 | 一 .51087 | .95871 1.25192 | 一 .47171 | 一 1. 11472| 一 . 91966 .44875 
8 .87973 .36062 1.52071 .26250 1. 10347| .87755 | 一 .01210 | 一 1.07121 
9 一 1. 29998| .99169 一 .90086 .34327 .53910 .73524 1.07697 .88303 
10 一 .45948 | .61605 | 一 .28100 | 一 . 11106 | .16005 | 一 .83011 | 一 1.82721| 一 1.72262 
11 .54913 1. 14195 .95871 | 一 .26250 | 1.42356 | 一 .47435 | .29042 .88303 
12 2. 06204 1. 14195 1. 20665 1. 63052 2. 05532 1. 01985 1. 07697 .44875 
13 .38103 1.74297 .33885 .49471 | 一 .47171 | 1.01985 .10891 1. 53444 
14 一 .45948 .36062 1.01971| 一 1.73523 A 一 .31462 .44875 
1. 89394 985 | 1.56100 88303 















































和 1. 000 .495 .490、 N335 .239 270 567 
X2 .495 1.000 省 1 > .663 419 216 363 
Xs 7 .490 > 310 为 1. 000 .002 477 410 216 
Xi | 002 1. 000 283 一 . 295 011 
Xs 276 ys .508 .311 .472 
二 .419 .477 I 283 .508 1. 000 .421 .510 
Xr" .216 410 一 .295 311 421 1.000 787 
Xs .56 .363 .216 .011 .472 .510 -P87 1. 000 

















(3) 计算 相关 系数 矩阵 的 特征 值 、 方 差 贡 献 率 和 累计 方差 贡献 率 ， 如 表 8 -9 所 示 。 
表 8-9 特征 值 、 方 差 贡 献 率 和 累计 方差 贡献 率 





























公共 因子 特 征 值 方差 贡献 率 累计 方差 贡献 率 
1 3. 641 45. 511 45. 511 
2 1.706 21. 329 66. 839 
3 .855 10. 687 77. 527 
4 .768 9. 601 87. 127 
5 .491 6. 140 93. 268 
6 .368 4. 603 97. 870 
多 .140 iYsl 99. 621 
8 .030 .379 100. 000 
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从 表 8-9 可 见 ， 前 4 个 特征 值 的 累计 方差 贡献 率 已 经 达到 了 87.127%， 说 明 前 4 个 
公共 因子 基本 包含 了 全 部 指标 的 主要 信息 。 因 此 ， 我 们 取 前 4 个 公共 因子 。 
(4) 建立 因子 载荷 阵 并 实行 方差 最 大 正 交 旋 转 ， 如 表 8 -10 和 表 8-11 所 示 。 


表 8-10 因子 载荷 阵 























公共 因 于 
标准 化 成 绩 
1 2 3 4 
Xl 737 114 115 一 . 607 
X: .729 473 一 . 049 .011 





























标准 化 成 绩 经 经 


SANGNUR 的 四 了 在 了 
BH 5 
> 了 7 公共 国字 


























Xi > .546 25 .508 一 .449 
Xz! > .821 > .189 .105 
We .080 .145 .963 .179 
xX 913 = 一 .061 .071 
Xs’ .636 .440 lat “16 
Xe ' .363 .358 .300 .749 
X7 二 :184 .878 .243 . 209 
Xs .229 .939 .062 .036 














显然 ， 旋 转 后 的 因子 载荷 系数 取 值 明显 更 加 极端 ， 即 取 值 更 加 向 0 或 1 靠近， 这 样 公 
共 因 子 的 解释 和 命名 应 更 加 容易 。 

由 表 8- 11 可 知 ， 第 一 公共 因子 Fi 上 载荷 系数 较 大 的 指标 有 历史 成 绩 Xi 、 化 学 成 绩 
X2、 英 语 成 绩 Xi 、 地 理 成 绩 Xs ， 可 命名 为 “文史 因子 ”; 第 二 公共 因子 Fs 上 载荷 系数 较 
大 的 指标 有 几何 成 绩 Xy7 、 代 数 成 绩 Xs ， 可 命名 为 “数理 因子 "; 第 三 公共 因子 Fs 上 载荷 
系数 较 大 的 指标 有 : 语文 成 绩 Xs ， 可 命名 为 “语文 因子 "; 第 四 公共 因子 F4 上 载荷 系数 
较 大 的 指标 有 物理 成 绩 Xs ， 可 命名 为 “物理 因子 ”。 
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(SS 加 该 专栏 8- 2 


因子 分 析 在 市 场 调研 中 的 应 用 


市 场 调研 过 程 中 ， 研究 人 员 经 常 面 对 大 批量 的 数据 ， 这 些 数 据 不 但 数据 量 大 ， 涉 及 的 变量 众多 ， 而 
且 变 量 之 间 往 往 存 在 一 定 的 相关 性 ， 为 分 析 问题 带 来 了 一 定 的 难度 。 因 此 ， 如何 正 确 有 效 地 处 理 这 些 多 
变量 大 样本 的 数据 ， 既 是 研究 人 员 感 兴趣 的 一 个 问题 ， 也 是 研究 人 员 需 要 具备 的 一 种 能 力 。 在 这 方面 ， 
因子 分 析 有 着 较为 广泛 的 应 用 。 因 子 分 析 在 市 场 调研 的 各 个 领域 有 着 广泛 的 应 用 。 

(1) 消费 者 使 用 习惯 和 态度 的 研究 。 对 消费 者 对 产品 的 态度 探查 往往 需要 使 用 因子 分 析 ， 探 查 影响 
消费 者 产品 态度 的 基本 因子 ， 并 在 此 基础 上 ， 利 用 各 因子 进行 聚 类 分 析 ， 对 消费 者 进行 细 分 ， 从 而 达到 
市 场 细 分 的 目的 。 在 这 里 ， 基 本 因子 在 消费 群 的 细 分 中 具有 基础 性 作用 。 倒 如， 选取 有 关 啤 酒 饮用 的 20 
个 态度 语句 ,采用 5 级 量 表 法 (1 一 非常 不 满意 ,5 一 非常 满意 ) pre 品 态 度 调 查 ， 因 子 分 析 
的 结果 给 出 了 影响 产品 态度 的 6 个 态度 因子 : 男子 气概 、 品 牌 转换 KN 额外 利益 的 啤酒 、 独 自在 
家 饮 、 社 会 认可 、 品 牌 试验 者 /社交 饮用 者 。 再 如 ， 因 子 分 析 新 车 的 购买 者 主要 关注 购车 因 
子 包 括 经 济 性 、 方 便 性 、 性 能 、 舒 适度 和 豪华 性 5 个 方面 六 A 加 以 产生 5 个 细 分 市 场 。 

(2) 品牌 形象 和 特性 研究 。 产 品 调研 中 ， wri 和 产品 属性 。 例如， 顾客 如 何 评价 银行 
多 ? 对 15 个 有 关 银行 特性 的 变量 的 因子 分 析 表 明 ?1 焦 人 务 (包括 贷款 利率 、 社 会 声望 ) 、 方 便 性 〈 包 
括 服务 速度 、ATM 机 的 位 置 等 ) 、 可 见 度 KE 荐 、 社 会 活动 的 参与 度 等 ) 及 能 力 (包括 雇员 能 

时 六 国 为 、 abe 从 代行 时 所 使 用 的 4 个 评价 因子 。 

(3) 满意 度 研究 ， tN 以 
Re 
【期 刊 推荐 】 资料 来 源 》 https Dlibrary. 3see. col /ey 003/ /02/19/4753. html. 


主 成 分 子 分 析 的 区 别 
ad 


主 成 分 分 析 和 因子 分 析 都 是 用 较 少 的 综合 变量 表达 多 个 观测 变量 的 多 元 统计 方法 。 在 
算法 上 二 者 很 类 似 ， 都 依赖 于 原始 变量 ， 也 只 能 反映 原始 变量 的 信息 。 因 子 分 析 的 公共 因 
子 的 提取 方法 很 多 ， 主 成 分 提取 方法 是 其 中 的 一 种 。 因 此 ， 我 们 可 以 这 样 认 为 ， 主 成 分 分 
析 是 因子 分 析 中 的 一 步 ， 因 子 分 析 是 主 成 分 的 一 个 应 用 和 发 展 。 主 成 分 分 析 和 因子 分 析 的 
区 别 主要 体现 在 ， 

(1) 主 成 分 分 析 是 将 主 成 分 表示 为 原 观测 变量 的 线性 组 合 ， 即 
Pi=un Xituiz Xt*tumnXm (i=1,.…,p) 

而 因子 分 析 是 将 原 观测 变量 表示 为 各 公共 因子 的 线性 组 合 ， 即 
Xi=anFitazFst*+amF ,te (i=1,.*,m) 

(2) 主 成 分 分 析 中 ,公共 因子 数 等 于 变量 数 ， 没 有 特殊 因子 ; 而 因 于 分 析 中 ,公共 因 
子 数 少 于 变量 数 ， 有 各 变量 的 特殊 因子 。 

(3) 主 成 分 分 析 不 需要 有 假设 .因子 分 析 则 需要 一 些 假设 。 因 子 分 析 的 假设 包括 各 个 
共同 因子 之 间 、 特 殊 因子 之 间 、 共 同 因子 和 特殊 因子 之 间 不 相关 。 

(4) 主 成 分 分 析 中 ， 每 个 变量 的 系数 wi 唯一 确定 ; 但 因子 分 析 中 ， 每 个 因子 的 系数 
5 不 是 唯一 的 。 
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(5) 主 成 分 分 析 的 重点 在 于 解释 各 个 变 基 的 总 方差 ， 而 因子 分 析 则 把 重点 放 在 解释 各 
变量 之 问 的 协 方差。 

同 主 成 分 分 析 相 比 ， 由 于 因子 分 析 可 以 使 用 旋转 方法 帮助 解释 因子 ， 因 此 在 解释 方面 
更 加 有 优势 。 大 至 说 来 ， 当 需要 寻找 潜在 的 因子 ， 并 对 这 些 因子 进行 解释 的 时 候 ， 更 加 个 
向 于 使 用 因子 分 析 ， 并且 借助 旋转 方法 帮助 更 好 地 解释 。 而 如 果 想 把 现 有 的 变量 变 成 少数 
几 个 新 的 变量 〈 新 的 变量 几乎 带 有 原来 所 有 变量 的 信息 ) 来 进入 后 续 的 分 析 ， 则 可 以 使 用 
主 成 分 分 析 。 当然， 这 种 情况 也 可 以 使 用 因子 得 分 做 到 ， 所 以 这 种 区 分 不 是 绝对 的 。 

出 贡 国 与 蝎 ( 
主 成 分 分 析 与 因子 分 析 对 数据 的 要 求 

A Sd ead ri A re | 

相关 性 较 弱 ， 运 用 主 成 分 分 析 与 因子 分 析 后 不 能 起 到 很 好 的 降 维 作用 人 好 及 得 的 各 个 


人 能 力 差别 不 大 。 一 般 ， 当 原始 数据 大 部 丛 疾 测 的 相关 系 ee 
于 0.3 时 ,运用 主 成 分 分 析 及 因子 分 析 不 会 得 
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8.4 用 SPSS 软件 进行 因子 分 析 


SS 四 国 亲 区 回 
8.4.1 因子 分 析 的 SPSS 操作 过 程 、 % > 六 站 
人 亩 


(1) 选择 “ Analyze sDiménsion Reduction 二 ac 区 选项 ， 弹 出 “Factor 【期 刊 推荐 】 
Analyze” 对 话 框 。 A . 

(2) 在 “Factor Analyze” 二 部 变量 。 布 侧 
的 “Variables* 列表 框 存放 的 是 需 进行 因子 分 析 的 变量 。 右 下 侧 的 “selection Variable” 
列表 框 存放 的 是 选 信 的 某 个 变量 ， 通过 它 的 取 值 来 确定 参加 因子 分 析 的 数据 ， 单 击 “Val- 
ue” 按 钮 ， 弹 出 “Factor Analysis: Set Value” 对 话 框 ， 输 入 一 个 整数 值 . 这 样 变量 中 只 
有 等 于 该 值 的 记录 才能 进入 因子 分 析 过 程 ; 车 忽略 此 项 ,表示 采用 全 部 数据 进行 因子 
分 析 。 

(3) 单 击 “Descriptives” 按 钮 ， 弹 出 “Factor Analysis: Descriptives” 对 话 杠 ,选择 
输出 描述 统计 量 和 初始 分 析 结果 。 

g@ Statistics 选项 组 : 输出 描述 统计 量 ， 包 含 两 个 复 选 框 。 

a，、Univariate descriptives 复 选 框 :输出 各 变量 的 均值 、 标 准 差 等 。 

b，Initial solution 复 选 框 : 输出 初始 因子 分 析 结果 。 选 择 此 项 可 以 输出 原始 变量 的 共 
同 度 ， 与 变量 数目 相等 的 各 因子 的 特征 值 、 各 因子 特征 值 占 总 方差 的 百分比 及 累积 百 
分 比 。 

四 Correlation Matrix 选项 组 : 输出 相关 系数 矩阵 ， 包 含 7 个 复 选 框 ， 下 面 列 出 常 
选项 。 

a. Coefficients 复 选 框 : 输出 相关 系数 矩阵 。 

b. Significance levels 复 选 框 : 输出 相关 系数 单 侧 检验 的 概率 p 值 。 
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c, KMO and Bartlett's test of sphericity 复 选 框 : 进行 KMO 检验 和 Bartlett 球 度 检 
验 , 判断 是 否 适合 做 因子 分 析 。 一 般 要 求 KMO 值 与 1 越 接近 越 好 ， 当 小 到 一 定 程度 时 认 
为 不 能 接受 ; Bartlett 检验 偏 相 关 和 矩阵 是 否 为 一 单位 和 矩阵， 若是 单位 矩阵 ， 则 认为 不 能 
接受 。 

KMO 值 参 考 标准 : 0. 9 二 KMO: 非常 适合 ; 0. 8 二 KMO<=0.9: 适合 ; 0.7 二 KMO 到 
0. 8: 一 般 适 合 ; 0. 6 二 KMO 二 0.7: 不 太 适 合 ; KMO 二 0. 5: 不 适合 。 

@ 单 击 “Continue” 按 钮 ， 返 回 “Factor Analyze” 对 话 框 。 

(4) 单 击 “Extraction” 按 钮 ， 弹 出 “Factor Analysis: Extraction” 对 话 框 ， 选 择 指 
定 提取 公共 因子 的 方法 。 

外 Method 框 : 从 所 提供 的 多 种 公共 因子 提取 方法 中 选择 需要 的 方法 ， 其 中 主 成 分 法 
(Principle components) 是 系统 默认 的 方法 ， 也 是 常 采用 的 提取 欢 共 因子 的 方法 

@ Analyze 选项 组 : 指定 分 析 的 矩阵 类 型 ， 包 含 2 个 单 选 按 钮 。 

a。Correlation matrix 单 选 按钮 :使 用 相关 系数 算 隆 八 提取 公共 因子 的 依据 。 

b，Covariance matrix 单 选 按钮 : 使 用 协 方差 矩 ened 

@ Display 选项 组 : 答 出 未 经 旋转 的 有 关 因 于 为 结果 ， 包 含 2 个 复 选 框 。 

a. Unrotated factor solution 复 选 框 : 2 法 未 经 旋转 的 因子 载荷 矩 阵 。 是 系统 默认 
方式 ， SN 

b，Scree plot 项 : 公关 风光、 按 特征 值 大 小 排列 公共 因子 序号 ， 以 特征 值 
为 两 个 坐标 轴 画 出 公共 因子 碎 丰 图、 以 此 来 确定 保留 的 父 共 因子 个 数 。 

@ Extract 选项 组 :选择 确定 公共 因子 个 数 ， 等 名 个 单 选 按钮. 

a，Eigenvalues ovef 单 选 按钮 : 往外 认 值 为 1)， 确定 特征 值 大 于 该 数值 
的 公共 因子 。 ”分 ~ 和 *， 

b，Number(ol fhetors 单 选 按钮 ， 指定 提取 特征 值 (公共 因子 ) 的 具体 数目 。 

@ Maximuin Iterations for Convergence 项 : 指定 因子 分 析 收 敛 最 大 迭代 次 数 。 其 目 
的 是 防止 进入 死 循环 ， 系 统 默认 值 为 25。 

@ 单 击 “Continue” 按 钮 ， 返 回 “Factor Analyze” 对 话 框 。 

(5) 单 击 “Rotation” 按 钮 ， 弹 出 “Factor Analysis: Rotation” 对 话 框 ， 选择 因 子 旋 
转 方法 。 
@ Method 选项 组 : 选择 因子 旋转 方法 ， 包 含 6 个 单 选 按 钮 ， 下 面 介绍 常用 的 两 项 。 
a None 单 选 按钮 : 不 进行 旋转 ， 是 系统 默认 的 方式 。 
b，Varimax 单 选 按钮 : 方差 最 大 化 旋转 。 
@ Display 选项 组 : 输出 旋转 后 的 有 关 因 子 分 析 结 果 ， 包含 2 个 复 选 框 。 
a Rotated solution 复 选 框 : 显示 旋转 后 的 因子 载荷 矩阵 。 
b. Loading plots 复 选 框 : 显示 旋转 后 的 因子 载荷 散 点 图 。 指 定 此 项 将 给 出 以 两 两 公 
子 为 坐标 轴 的 各 变量 的 载荷 散 点 图 。 
图 Maximum iterations for Convergence 项 : 输入 一 个 数值 ， 指 定 旋转 收敛 的 最 大 次 
数 ， 系 统 默认 值 为 25。 

图 单 击 “Continue” 按 钮 ， 返回 “Factor Analyze” 对 话 框 。 
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(6) 单 击 “Scores” 按 钮 ， 弹 出 “Factor Analysis: Scores” 对 话 框 ， 选 择 计算 因子 
得 分 的 方法 。 

@ Save as variable 复 选 框 : 将 公共 因子 得 分 作为 新 变量 保存 在 数据 文件 中 ， 新 变量 
名 的 形式 为 FACn_m， 其 中 n 是 公共 因子 编号 ，m 是 第 几 次 分 析 的 结果 ; 同时 Method 
栏 中 各 选项 被 激活 。 

Method 选项 组 : 指定 计算 因子 得 分 的 方法 ， 包 含 3 个 单 选 按钮 。 最 常用 的 是 回归 法 
(Regression) 。 

回 Display factor score coefficient matrix 复 选 框 : 输出 因子 得 分 函数 中 的 各 因子 得 分 
系数 矩阵 。 它 是 标准 化 后 的 得 分 系数 ， 根 据 该 矩阵 给 出 的 系数 可 以 计算 出 各 观测 量 的 因子 
得 分 。 

图 单 击 “Continue” 按 钮 ， 返 回 “Factor Analyze” 对 话 框 引入 

(7) 单 击 “Options” 按 钮 ， 弹 出 “Factor Analysis: Quo 对 话 框 ， 选 选择 缺失 值 
的 处 理 方法 。 < 

@ Missing Values 选项 组 : 指定 缺失 值 的 处 理 A 3 个 单 选 按钮 。 

a，Exclude cases listwise 单 选 按钮 :所 有 aA 观测 值 均 不 参与 计算 。 适 用 于 样 
本 量 较 多 的 情况 。 

b. Exclude cases pairwise 单 选 按钮 SN 缺失 值 的 观测 值 。 在 计算 两 个 变 
量 的 相关 系数 时 ， 只 将 这 这 两 个 变量 中 次 实 值 的 观测 值 吻 除 。 适用 于 样本 量 较 少 的 
情况 。 WX™ 2 

c。Replace with mean 弟 渤 按 钥 ; We 适用 于 样本 量 较 少 而 样本 精 
确 值 要 求 不 高 的 情况 。 

© Coefficient Format 人 子 载荷 矩阵 的 输出 方式 。 包含 2 个 复 
选 框 。 r 四 

a. slaae 以 第 一 公关 因子 得 分 的 降序 输 1 出 因子 载荷 矩阵 ， 便 于 进行 
分 析 。 

b.Suppress absolute values less than 单 选 按钮 : 输入 一 个 界 于 0 和 1 之 间 的 数值 。 表 
示 只 输出 大 于 该 数值 的 因子 载荷 ， 以 突出 载荷 量 较 大 的 变量 ， 便 于 分 析 。 

图 单 击 “Continue” 按 钮 ， 返回 “Factor Analyze” 对 话 框 。 

(8) 单 击 “OK” 按 钮 ， 输 出 因子 分 析 结 果 


8.4.2 因子 分 析 的 SPSS 输出 结果 解释 


【 例 8. 3】 改革 开放 以 来 . 我 国 居民 收入 水 平 、 教 育 水 平 、 医 疗 水 平均 有 大 幅度 的 增 
长 ,但 由 于 我 国 各 地 区 地 域 资源 、 资 金水 平等 基础 不 同 ， 生 产 力 发 展 水 平 不 一 致 ， 造 成 区 
域 经 济 发 展 的 不 平衡 ， 因 此 有 必要 对 我 国 当前 各 地 区 综合 发 展 情况 进行 比较 研究 ， 为 促进 
地 区 经 济 的 协调 发 展 和 宏观 决策 提供 重要 依据 。 为 此 ， 对 我 国 2014 年 31 个 省 、 自 治 区 
直辖 市 综合 发 展 情况 进行 综合 评估 ,选取 6 项 指标 ， 即 人 均 GDP (元 ) Xi 、 新 增 固 定 资 
产 〈 亿 元 ) X? 、 城 镇 居民 人 均 年 可 支配 收入 〈 元 ) X3、 农 村 居民 人 均 可 支配 收入 (元 ) 
X4 、 高 等 学 校 数量 (所 ) Xi 、 社 区 卫生 服务 中 心 数量 Xi ， 原 始 数据 资料 如 表 8 - 12 
所 示 。 
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表 8-12 2014 年 全 国 31 个 省 、 自 治 区 、 直 辖 市 综合 发 展 情况 资料 


























































































































地 区 xX xX Xs Xs Xs Xe 
北京 99995 6924. 2 48531.8 18867.3 89 322 
天 津 105231 10518.2 31506 17014.2 55 109 
河北 39984 26671.9 24241.3 10186. 1 118 274 
山西 35070 12354.5 24069. 4 8809. 4 79 209 

内 蒙古 71046 17591.8 28349. 6 9976. 3 50 292 
于 学 65201 24730. 8 29081.7 11191;5 116 360 
吉 50160 11339.6 23217.8 10780.1 58 202 

黑龙 江 39226 9829 22609 10453.2 r 80 438 
上 海 97370 6016.4 48841.4 21191.8 - 区 68 305 
江苏 81874 41938. 6 34346. 3 SN 159 543 
浙江 73002 24262.8 40392.7 ,| Xi9373.8 104 481 
安徽 34425 21875.6 24838. $C CT 4 118 406 
福建 63472 18177.9 Dn 88 219 
江西 34674 15079.3 /24309: 10116.6 95 168 
山东 60879 42495 Ts 11882.3 141 510 
河南 37072 whe 23672.1 9 RY 129 402 

-一 一 一 - - 

湖北 47145 722945. 3 24852. 3 ps 9.1 123 325 
湖南 40271 一 21242.9 26570: 人 10060.2 124 284 
广东 i 26293.9 sD 12245. 6 141 1057 
广西 0 13843.2 ‘S2569 8683.2 70 144 
海南 4 `38924 3112.2 24486.5 9912.6 17 22 
重庆 47850 12285. 4 25147. 2 9489.8 63 203 
四 川 35128 23318. 6 24234.4 9347.7 107 397 
贵州 26437 9025.8 22548. 2 6671.2 55 157 
云南 27264 11498.5 24299 7456. 1 67 163 
西藏 29252 1069. 2 22015.8 7359.2 6 包 

陕西 46929 17191.9 24365. 8 7932.2 92 245 
甘肃 26433 7884. 1 21803.9 6276. 6 43 203 
青海 39671 2861.2 22306. 6 7282.7 12 23 
宁夏 41834 3173.8 23284.6 8410 18 16 
新 疆 40648 9447.7 23214 8723.8 44 183 
资料 来 源 :《 中 国 统计 年 鉴 (2015)》。 


需要 回答 的 问题 : 
(1) 使 用 因子 分 析 方 法 对 各 省 、 自 治 区 、 直 辖 市 进行 综合 评估 。 
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(2) 根据 各 省 、 自 治 区 、 直 辖 市 的 综合 评估 结果 ,指出 其 优势 和 不 足 。 
解 : (1) 将 数据 标准 化 。 7 
(2) 建立 指标 间 相 关系 数 和 矩阵， 如 表 8- 13 所 示 。 了 
表 8-13 相关 系数 矩阵 (Correlation Matrix*) 项 纲 因 了 
过 城镇 居民 农村 居民 社区 卫生 
系数 及 检验 指标 六 Se hi 年 均 可 支配 | 人 均 可 支配 由 服务 中 心 
收入 收入 数量 
人 均 GDP 1.000 | .175 .855 .890 .221 .298 
新 增 固定 资产 | .175 1. 000 .118 3s .899 .685 
城镇 居民 年 均 - | 入 
.855 .118 1. 928 268 354 
相关 系数 | 可 支配 收入 i 
矩阵 十 居 5 \ 
让 农村 居民 大 光 .890 .193 af 二 - 1. 000 .319 .353 
orrelation | 可 支配 收入 a 
高 等 学 校 数 量 | .221 .899 NF .319 1. 000 .774 
社区 卫生 服务 MY 
.298 .685 .354 .353 .774 1. 000 
中 心 数量 NAL 
人 均 GDP Ds .000 ee .000 .116 .052 
新 增 固定 资产 ~ 3 260% | ug .000 .000 
! 民 年 Po A 
显著 性 水 平 | _ 冰岛 同 只 他 |_.000 .263 p wy .000 .073 .025 
CR 可 支配 收入 天 
矩阵 -一 - 本 
农村 居民 人 均 < 
Sig. | .000 .项 < :000 .040 .026 
Gtailed)》 | 可 由 入 | 
向 等 学 校 数量 | .116 .000 .073 .040 .000 
社区 卫生 服务 E EE 
.052 -000 x025 .026 .000 
中 心 数量 
表 8-13 给 出 了 各 指标 间 的 相关 系数 矩阵 及 各 个 相关 系数 的 显著 性 水 平 。 其 中 表 的 上 








半 部 分 为 相关 系数 矩阵 〈Correlation)， 值 的 绝对 值 越 大 ， 相 关 性 越 高 ;下 半 部 分 为 显著 
性 水 平 矩 阵 ， 值 越 小 ， 相 关 性 越 显 著 。 由 于 一 部 分 的 相关 系数 较 高 ， 各 指标 呈 较 强 的 线性 
关系 ， 能够 从 中 提取 公共 因子 . 适合 进行 因子 分 析 。 

(3) 进行 KMO 和 巴特 利 特 球 度 检验 ， 如 表 8 - 14 所 示 。 


表 8-14 KMO 和 巴特 利 特 球 度 检验 (KMO and Bartletts Test) 











Kaiser- Meyer — Olkin Measure of Sampling Adequacy. .703 
Approx. Chi- Square 179. 201 

Bartletts Test of Sphericity df Is 
Sig. .000 
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由 表 8-14 可 知 ，KMO 值 为 0.703， 根据 KMO 值 参考 标准 ， 比 较 适 合 进行 因子 分 
析 ; 巴特 利 特 球 度 检验 统计 量 的 观测 值 为 179. 201， 相 应 的 概率 p 值 为 0.000， 如 果 取 显 
著 性 水 平 a 二 0.05， 由 于 概率 p 值 小 于 显著 性 水 平 a， 应 拒绝 零 假设 ,认为 相关 系数 矩阵 


与 单位 阵 有 显著 差异 ， 适 合 进行 因子 分 析 。 


(4) 计算 指标 的 共同 度 ， 如 表 8 一 15 所 示 。 


表 8-15 指标 的 共同 度 (Communalities) 























指 标 Initial Extraction 
人 均 GDP 1.000 .897 
新 增 固定 资产 1. 000 .890 
城镇 居民 年 均 可 支配 收入 1. 000 ! .933 
农村 居民 家 庭 人 均 收 入 1. 000 KS .951 
高 等 学 校 数 量 1. 000 SS 让 .934 
卫生 机 构 数 量 1.900 .778 





Extraction Method: Principal Component Analysis. 


XA 


由 表 8 一 15 可 知 ,第 2 列 显示 的 是 指标 科 和 冶 共 同 度 ， 它 表明 对 原 有 6 个 指标 采用 





主 成 分 分 析 方法 提取 所 有 特征 值 ， 可 消 指 标的 所 有 方差 部 可 被 解 各 ， 指标 的 共同 度 均 
为 各 第 3 列 显示 的 是 提取 .2 个 公共 因子 后 的 再 生 共同 


为 1 ( 原 有 指标 标准 化 后 的 方 








度 ， 可 以 看 到 ,该 列 的 全 部 数 部 较 大 (接近 于 1 ,) 涪 明 所 有 指标 的 共 同 度 均 较 高 ， 各 个 





指标 的 信 


分 方法 提取 公 


失 都 较 少 ， 即 所 提 的 2 个 公共 | hom 这 些 指标 。 
表格 下 侧 的 “ “Extraction Method: 外 Al Component Analysis” 显 示 采 用 的 是 主 成 





kt 因 和 >“ 
(5) ei 方 关 贡 献 率 和 累计 访 关 贡献 率 ， 如 表 8 一 16 所 示 。 
表 8-16 因子 解释 原 有 指标 总 方差 的 情况 (Total Variance Explained) 



































Extraction Sums of Rotation Sums of Squared 
Initial Eigenvalues 
Squared Loadings Loadings 
Component 
% of | Cumulative % of |Cumulative % of | Cumulative 
Total Total Total 
Variance % Variance % Variance % 
bE 3.458| 57.640 57.640 |3.458| 57.640 57.640 |2.804| 46.730 46.730 
2 1.925| 32.076 89.716 |1.925| 32.076 89.716 |2.579| 42.986 89.716 
3 .326 5.437 95. 153 
4 .168 2. 807 97. 960 
5 .065 1.079 99. 038 
6 .058 .962 100. 000 
Extraction Method: Principal Component 
Analysis. 























(6) 输出 因子 分 析 结 果 的 碎 石 图 ， 如 图 8.2 所 示 。 


Scree Plot 
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Eigenvalue 
局 








2 3 4 3 
Component Numbe < ， 


图 8.2 因子 的 玉石 See Plot) 





由 图 8. 2 可 知 ， 本 从 村 为 特 钙 人 序号 ， 红 入 和 为 竺 全 人， 图 中 明显 的 拐点 为 3， 可 以 
得 出 保留 2 个 公共 因子 将 能 概括 原 有 痢 燃 的 大 部 分 信息 (89. 716%)， 进 而 进一步 直观 说 
WN\ 


明 提取 2 个 公共 因子 是 合适 的 。 
(7) 输出 因子 载荷 矩阵 属 好 表 817 所 示 。 


7 
py Wx 


Pa ef 1 
> 07 因子 载荷 矩阵 (com neiit Matrix* ) 
> 入 Component 


和 加 EL 


























XS 六 TP 1 2 
”人 均 GDP .785 一 .530 
新 增 固定 资产 635 .698 
城镇 居民 人 均 年 可 支配 收入 807 =s8M 
农村 居民 人 均 可 支配 收入 840 一 . 496 
高 等 学 校 数量 .732 630 

社区 卫生 服务 中 心 数量 .739 481 








Extraction Method: Principal Component Analysis. 





a. 2 components extracted. 








表 8-17 是 
的 影响 程度 ， 即 

















子 分 析 的 核心 结果 ， 模 型 中 各 公共 因子 前 的 系数 表示 该 公共 因子 对 指标 
子 载荷 。 表 格 下 侧 的 “Extraction Method: Principal Component Analy- 


sis” 显 示 采 用 的 是 主 成 分 方法 提取 公共 因子 , “a. 2 components extracted” 表 示 提 取 了 2 





个 公共 


公共 因子 。 可 以 看 出 ， 这 两 个 公共 因子 的 实际 意义 并 不 很 清楚 。 
(8) 输出 旋转 后 的 因子 载荷 矩阵 ， 如 表 8 一 18 所 示 。 











| 301 


302 | 应 用 统计 学 (第 3 版 ) »》 


表 8-18 旋转 后 的 因子 载荷 矩阵 (Rotated Component Matrix*) 























指标 得 分 人 
Zscore: 人 均 GDP .941 -112 
Zscore: 新 增 固定 资产 .024 943 
Zscore: 城镇 居民 人 均 年 可 支配 收入 .958 :125 
Zscore: ”农村 居民 人 均 可 支配 收入 .960 “5 
Zscore: 高 等 学 校 数 量 .143 .956 
Zscore: 社区 卫生 服务 中 心 数 量 .245 .847 











Extraction Method: Principal Component Analysis. 


Rotation Method: Varimax with Kaiser Normalization. 


a, Rotation converged in 3 iterations. Er 


表格 下 方 显示 的 “Rotation Method: Varimax with Kaisé Narmalization” 为 旋转 方 
法 选取 方差 最 大 化 法 ，“a。Rotation converged in 5 endioim 为 实际 迁 代 次 数 选 择 5 次 。 
(9) 输出 因子 旋转 中 的 正 交 和 矩阵 ， 如 表 8 -19 所 荣 











个 
NS 
表 8-19 因子 转化 矩阵 (ComponentTransformation Matrix) 
Component 二 > 站 
1 dN 5 | .653 
.757 















S 

Extraction Method: Principal RS Anal AM 
op ,VX 

Rotation Method: Varimax with Kaiser Normalization. x 1 


未 旋转 的 因子 载 箱 甜 阵 ( 表 8- 17) 有 以 六 于 转 报 逢 了 ( 表 8-19)， 就 可 得 到 旋转 
后 的 因子 载荷 矩阵 `\( 洛 8 -18)。 pe 
(10) 输 败 办 字 旋 转 后 的 三 维 因子 载荷 疼 ， 如 图 8. 3 所 示 。 


Component Plot in Rotated Space 




















1.0| Ex2 ZX5 
”ZX6 
2 
0.5 
i ZX4。 
的 BZXI| 
所 
加 0 ZX1 
§ 
a 
§ 
S 
Do 
0s) 
iol 
, 1 , , 
10 -03 0 05 10 
Component 1 


图 8.3 因子 旋转 后 的 三 维 因子 载荷 图 (Component Plot in Rotated Space) 
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由 此 直观 说 明 旋 转 后 各 公共 因子 的 指标 的 分 布 集中 情况 。 
(11) 输出 公共 因子 得 分 系数 矩阵 并 计算 因子 得 分 ， 如 表 8 一 20 和 表 8- 21 所 示 。 


表 8-20 公共 因子 得 分 系数 矩阵 (Component Score Coefficient Matrix) 
































Component 
指 标 
2 
人 均 GDP :62 一 . 060 
新 增 固定 资产 一 .098 .395 
城镇 居民 人 均 年 可 支配 收入 357 一 . 056 
农村 居民 人 均 可 支配 收入 352 —.036 
高 等 学 校 数量 = 00 .386 
社区 卫生 服务 中 心 数量 "07. Ks 329 





Extraction Method: Principal Component Analysis. 


Rotation Method: Varimax with Kaiser Normalization. 


Component Scores. 





将 原始 指标 的 标准 化 值 代入 因子 得 分 数 、 就 可 以 计算 各 样本 的 因子 得 分 ， 因 子 得 分 


以 新 变 基 的 形式 显示 在 数据 编辑 窗口 《 表 ; =21)， 并 以 此 对 观测 指标 进行 进一步 的 分 析 ， 


如 聚 类 或 回归 分 析 。 


ee 


















































~ 9 
a 因子 得 分 (Compdiieht Sore) 
人 人 1 二 EE 和 FAC2_1 
北京 ~ | 本 区 一 0.5934 
A | fs70 一 0.9840 
河 4 一 0.5517 0.7870 
山西 一 0.5838 =0. 1955 
内 蒙古 0. 3064 一 0. 2847 
辽宁 0. 2115 0. 7166 
吉 一 0. 1634 一 0.4974 
黑龙 江 一 0. 4162 0. 0731 
上 海 2. 9124 一 0.8721 
江苏 0. 8829 1. 9390 
浙江 1. 7038 0. 5880 
安徽 一 0. 5917 0. 8332 
福建 0. 5042 一 0.0444 
江西 一 0. 5005 一 0.0214 
山东 0. 0158 1. 8642 
河南 一 0.7015 1. 2661 
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( 续 ) 

省 份 FACI1_1 FAC2_1 
湖北 一 0. 3159 0. 7452 
湖南 一 0. 3980 0. 6386 
广东 0. 3868 2. 1056 
广西 一 0. 5982 一 0. 3282 
海南 一 0. 2279 —1.4557 
重庆 一 0. 2393 一 0. 4097 
四 川 一 0. 6639 0.7768 
贵州 一 0.9378 一 0.5750 
一 0. 总 伦 a 0 
一 0.7153 4 一 1.5896 

陕西 一 0.5250 < NB 0. 1409 
甘肃 一 0.9870 /并 一 0.6476 
青海 = NAN —1.4698 
EB 三 013865 一 1.4372 
新 疆 Mo. 4732 一 0.6857 





(12) 对 各 省 、 自 治 区 、 有 和 市 过 行 综 合 评 人 - 2 
多 机 人 人 基因 和 机 于 作 为 hs 建立 综合 评价 
模型 ， 


> AF 120. 57640 * FAC1 clk0 0 FAC2_1 
利用 etd 各 样本 得 分 FE， 并 利用 SPSS 的 排序 功能 对 各 
































省 市 自治 区 的 展 水 平 进行 了 排序 比较 。 结 果 如 表 8 - 22 所 示 。 
表 8-22 各 省 市 自治 区 综合 发 展 水 平 的 排序 比较 
按 第 一 公共 因子 按 第 二 公共 因子 
号 交 秆 加 太 光 分 扩 多 得 分 排名 得 分 排名 

1 上 海 上 海 广东 

有 北京 北京 江苏 

3 浙江 天 津 山东 

4 江苏 浙江 河南 

5 广东 江苏 安徽 

6 天 津 福建 河北 

bg 山东 广东 四 川 

8 开学 内 蒙古 湖北 

9 福建 近年 过 字 

10 内 蒙古 山东 湖南 
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( 续 ) 
按 第 一 公共 因子 按 第 二 公共 因子 

全 WW 按 综合 得 分 排名 a 人 

11 湖北 吉林 浙江 

12 河南 海南 陕西 

13 湖南 重庆 黑龙 江 

14 河北 湖北 江西 

15 安徽 宁夏 福建 

16 四 川 湖南 山西 

17 黑龙 江 黑龙 江 入 内 蒙古 

18 吉 新 疆 eR 广西 

19 陕西 江西 3 云南 

20 重庆 7/ 陕 刻 、 重庆 

21 江西 SS 吉 

22 山西 SET 贵州 

23 证 NS- 山西 北京 

24 EN 安徽 XX1 、 甘肃 

25 访 南 ” 太 西 WX 新 疆 

26 ”而 十 i 上 海 

27 人 | 宁夏 关 NY 珂 机 天 津 

28 NS 人 贵州 全 驴 西藏 宁 爱 

29  / 甘肃 云南 海南 

30 青海 贵州 青海 

31 西藏 甘肃 西藏 














按 综 合 得 分 所 得 到 的 评估 结果 说 明了 各 省 市 自治 区 在 人 均 GDP、 新 增 固定 资产 、 城 
镇 居民 人 均 年 可 支配 收入 、 农 村 居民 人 均 可 支配 收入 、 高 等 学 校 数量 和 社区 卫生 服务 中 心 








数量 6 个 方面 的 发 展 水 寺 





EF; 按 第 一 公共 因子 得 分 所 得 到 的 评估 结果 说 明了 各 省 、 自 治 区 、 
直辖 市 在 人 均 GDP、 城 镇 居民 人 均 年 可 支配 收入 和 农村 居民 人 均 可 支配 收入 3 个 方面 的 综 





合 发 展 水 平 ( 即 收入 水 平 ); 按 第 二 公共 因子 得 分 所 得 到 的 评估 结果 说 明了 各 省 、 自 治 区 、 





直辖 市 在 新 增 固 
( 即 社会 发 展 水 平 )。 

















由 于 因子 分 析 法 是 以 由 原始 指标 组 成 的 每 个 公共 因子 的 方差 贡献 率 作为 
权重 来 构建 综合 评价 函数 ， 所 以 使 得 评价 结果 具有 很 强 的 客观 合理 性 。 根 据 
各 公共 因子 的 得 分 对 各 省 、 自 治 区 、 直 辖 市 的 发 展 情况 进行 评估 ， 能 够 发 现 
他 们 在 各 个 环节 的 优势 和 不 足 ， 以 便 制 定 科学 合理 的 决策 方案 。 


定 资产 、 高 等 学 校 数量 和 社区 卫生 服务 中 心 数量 3 个 方面 的 综合 发 展 水 平 






a 
【期 刊 推荐 】 
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A 实例 分 析 上 
基于 因子 分 析 的 中 国 金 融 风险 研究 


2008 年 始 于 美国 的 次 贷 危 机 发 展 成 全 面 金 融 危 机 ， 而且 向 实体 经 济 海 进 ， 向 全 球 莹 
延 ， 给 世界 经 济 带 来 严重 影响 。 

所 谓 次 贷 危 机 ， 简 言 之 ， 是 指 缺 乏 支付 能 力 而 信用 程度 又 低 的 人 在 买 了 住房 之 后 ,无力 
偿还 抵押 沉 款 所 引发 的 一 种 金融 问题 。 居 民 住房 是 不 动产 ， 很 难 发 生 位 置 移动 ， 因 而 即使 发 
生 供 求 问 题 及 由 此 引发 金融 问题 ， 也 应 只 限于 一 定 地 区 的 范围 之 内 。 然 而 在 美国 ， 这 个 问题 
却 成 了 波及 全 国 以 至 全 球 的 问题 。 这 是 什么 原因 造成 的 呢 ? 主要 是 由 于 一 种 金融 衍生 品 即 
“入 客 检 贷款 支社 证 茶 ” 的 洲 造 记 的 。 一 旦 全 融 他 生 品 介入 把 住房 拆 抑 贷款 证 券 化 ， 
就 会 展开 无 穷 的 金融 交易 。 这 种 证 券 既 可 以 在 国内 金融 市 场 又 可 以 在 国际 金融 市 
场 不 断 流通 ， 于 是 就 把 住房 问题 由 局 部 问题 变 成 全 局 问题 、 员 ] 0 
题 。 当 第 一 个 环节 出 现 问题 ， Rs 


行 了 。 不 仅 如 此 。 前 几 年 美国 住房 市 场 火爆 ， 即 狐 押 货款 证 券 也 成 为 抢手 货 。 在 这 
种 情况 下 ， 不 少 金 融 机 构 把 这 种 十 分 畅销 的 人 er 
“打包 ”出 售 (通俗 地 说 ， 就 是 买 匣子 还 上 这 样 ， 多 年 积累 下 的 大 量 金融 残 次 品 


甚至 垃圾 就 像 油 涌 的 海浪 一 样 涌 向 全 其 后 果 就 是 金融 危机 的 爆发 。 

值得 砍 避 的 是 ， 尽 管 此 次 合 于 会 融 危 机 给 给 中 国 全 总 机 购 造成 一 定 的 冲击 ， 但 中 国 金 
融 机 构 的 状况 依然 稳健 。 这 六 注 爱丽 得 益 于 中 国 爹 3 仿 相 对 时间 最 重要 的 原因 则 是 得 益 
于 近年 来 中 国 金 融 机 构 党 和 nn 在 此 次 危机 中 没有 陷 
入 太 深 ， 但 未 来 路 往 哪 里 是 ? 相关 专家 表示 4 中国 金融 机 构 要 努力 回避 西方 金融 机 构 机 制 
方面 存在 的 胶 委 防范 金融 风险 ， 让 要 入 范 治理 风 丛 ， 这 样 才 能 真正 防范 系统 性 风 
dre, Soh 

通过 对 中 国 的 金融 风险 进行 研究 ， 可 以 把 握 金 融 风 险 的 发 展 趋势 ， 找 出 影响 金融 风险 
的 因素 ,制订 防 范 和 化 解 金融 风 险 的 有 效 措施 。 下 面 根据 中 国 的 实际 情况 和 选取 指标 的 原 
则 选取 了 9 个 具有 代表 性 的 指标 ( 表 8 一 23)， 并 搜集 了 1992 一 2014 年 的 数据 ( 表 8 一 24)。 


表 8-23 金融 风险 预警 监测 指标 





























指标 类 型 指标 名 称 临 界 值 

ee GDP 增长 率 (Xi ) 8% 

M2 增长 率 (X;) 10% 

资本 市 场 股票 市 价 总 值 /GDP (X;) 30% 

充足 性 国有 商业 银行 资本 充足 率 (X,) 8% 
一 利 性 国有 商业 银行 资本 收益 率 (Xs) 社会 平均 收益 率 的 一 半 

国债 国债 负担 率 (Xe) 20% 

进出 口 /GDP (X7) 5% 

外 资 外 债 偿 债 率 (Xs) 25% 

短期 外 债 /外 汇 储备 (Xs) 25% 
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表 8-24 1992 一 2014 各 指标 数据 













































































1992 

1993 10.2 63.9 
1994 9 20.2 
1995 ( 剖 1 16.2 
1996 6 13.4 
1997 7.3 13 
1998 0 12 
1999 lli3 9.8 
2000 9.2 ?59 
2001 7.5 23.8 
2002 9 17.1 
2003 6.9 19.1 
2004 3.2 19.5 
2005 3.1 19.07 
2006 2.1 17. 22 
2007 2 14. 39 
2008 1.8 10. 83 
2009 2.9 10. 81 
2010 10. 4 19.9 66.41 0.12 0. 2261 16. 97 50. 08 1.6 13. 19 
2011 9.3 17. 3 56. 2 0. 13 0. 2251 15. 28 48.78 1.72 15.75 
2012 7.6 14. 4 47. 3 0. 14 0. 2198 15.93 56.61 1.62 ev 
2013 7.6 13 42. 3 0.13 0.2123 15.09 73.23 1.57 17.18 
2014 7.4 16.7 40 0.15 0.1974 14. 88 22.6 1.91 17.78 





























数据 来 源 :《 中 国 金 融 年 鉴 )、 各 银行 年 报 、 国 家 外 汇 局 网 站 等 官方 网 站 。 


需要 分 析 的 问题 : 

(1) 利用 因子 分 析 方 法 对 中 国 金 融 风 险 进行 定量 分 析 。 

(2) 根据 因子 分 析 结 果 ， 对 如 何 控制 金融 风险 提出 对 策 建议 。 

一 、 学 习 目 标 

通过 本 案例 的 学 习 ， 要 求学 生 熟 练 掌握 因子 分 析 的 基本 方法 及 其 应 用 ; 考核 学 生 对 因 
子 分 析 的 理解 程度 。 
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二 、 案 例 分 析 

中 国 现行 的 一 些 金融 风险 分 析 的 方法 主要 是 定性 分 析 ， 其 显著 特征 是 简便 ， 易 于 理解 
和 操作 ， 但 评价 结果 具有 很 强 的 主观 性 ， 因 此 评价 结果 的 准确 性 和 客观 性 难以 令 人 信服 。 
而 因子 分 析 的 基本 思想 ， 简 单 地 说 ， 就 是 把 观测 变量 分 类 ， 将 相关 性 较 高 即 联系 比较 紧密 
的 变量 分 在 同一 类 中 ,使 不 同类 的 变量 之 间 的 相关 性 较 低 ， 那 么 每 一 类 变量 实际 就 代表 了 
一 个 本 质 因子 ， 因 子 分 析 就 是 寻找 系统 中 这 种 不 可 观测 的 因子 或 结构 。 以 此 为 出 发 点 ， 我 
们 可 以 利用 因子 分 析 方 法 对 中 国 的 金融 风险 进行 定量 分 析 ， 最 后 根据 因子 分 析 结果 ， 提 出 
对 策 建议 。 

(1) 我 国 金 融 风 险 的 因子 分 析 

利用 SPSS 22. 0 软件 ， 首 先进 行 相关 分 析 ， ee 并 
建立 变量 的 相关 数 距 阵 RR， 然 后 计算 出 R 的 特征 根 和 贡献 累计 方差 贡献 率 大 于 85 
ee 按照 这 个 原则 选取 了 4 个 因子 ， 其 累计 方 ja 为 90.610% ( 表 8 一 

。 其 中 第 一 个 因子 解释 能 力 占 所 有 变量 总 方差 的 55. 而 第 二 个 因子 解释 能 力 占 
PE 第 三 个 因子 解释 能 人 339%， 第 四 
个 因子 解释 能 力 占 所 有 变量 总 方程 的 7.044%。 MNO _ 


» NU 
表 8-25 Total Vi AN Explained 
人 Sums of Rotation Sums of Squared 





































































i NS Squared Loadin! Loadings 
ER % of op % of ive % of | Cumulative 
ee ge | 3 ee vw $ 国 % Eo Variance % 
1 4. 964 | 15 56) 55.156 |4. re: 55. B56” 55.156 |3.138| 34.872 34. 872 
2 1. 96 | ho 76.227 |1. S01< 1. 071 76.227 |2.181| 24.231 59. 103 
3 。 6 1 7. 339 83.566 | .661 7. 339 83.566 |1.733| 19.255 78. 358 
4 .634 7.044 90. 610 .634 7.044 90.610 |1.103| 12.252 90. 610 
5 496 5.511 96. 122 
6 135 1.500 97. 622 
7 110 1. 224 98. 845 
8 071 784 99. 629 
9 .033 .371 100. 000 
Extraction Method: Principal Component 
Analysis. 
为 使 因子 能 有 更 好 的 经 济 意义 对 变量 进行 解释 ， 需 要 进一步 进行 因子 旋转 ， 采 用 Kai- 





ser 方差 最 大 旋转 ， 公 因子 与 原 有 变量 指标 之 间 的 关联 程度 由 因子 载荷 值 表 征 。 因 子 载荷 
值 越 高 ， 表 明 该 因子 包含 该 指标 的 信息 量 越 多 。 表 8 - 26 为 经 5 次 正 交 旋转 的 因子 载荷 
矩阵。 



























































主 成 分 与 因子 分 析 
表 8-26 Rotated Component Matrix* 
指 六 Component 
1 和 3 4 
GDP 增长 率 .911 —.164 .080 .254 
M2 增长 率 .790 = 一 .199 二 
股票 市 价 总 值 /GDP a .329 .906 .146 
国有 商业 银行 资本 充足 率 = .892 :i .153 
国有 商业 银行 资本 收益 率 .842 一 . 068 = —. 280 
国债 负担 率 一 90 .492 .723 157 
进出 口 /GDP —.132 .363 K& .878 
外 债 偿 债 率 .080 一 .882 中 SN 39 一 57 
短期 外 债 /外 汇 储备 .859 .025: Mh 一 .279 一 .191 











y 
Extraction Method: Principal Component Analysis. SS 
AN 


Rotation Method: Varimax with Kaiser Normalization. 





和 < 站 a C 
a. Rotation converged in 5 iterations. 《A\ 入 





因子 分 析 的 经 济 意义 解释 。 ee 者 国有 商业 银行 
资本 收益 率 、 外 供 档 悄 率 委 基 外 向 [外汇 入 备 上 的 荷 值 较 大 ， 它 对 整个 国家 的 金融 风 
险 状 况 影响 最 大 ， 有 着 $52 的 方差 贡献 率 ， 公 共 国 子 -Fs 在 国有 商业 银行 资本 充足 率 及 
对 外 俩 偿 债 率 的 载荷 绝对 导 科 大 ， i 金融 风险 状况 影响 居 次 ， 有 着 21. 071% 











加 


的 方差 贡献 率 ; 从 辣子 在 股票 市 价 总 值 /GDP、 国 债 负担 率 上 的 载荷 值 较 大 ， 有 着 
7.339% 的 方 率 。 公 共 因子 书 在 进出 口 /GDP 上 的 载荷 值 较 大 ， 有 着 7.044% 的 方 
差 贡献 率 。 “ 

进行 因子 分 析 后 ， 由 回归 计算 出 因子 得 分 及 各 因子 的 方差 贡献 率 的 比例 作为 权重 进行 


























加 权 汇 总 ， 得 出 各 年 度 金融 风险 的 综合 得 分 下 ， 如 表 8 - 27 所 示 。 
表 8-27 因子 得 分 (Component Score) 

年 度 第 一 因子 得 分 | 第 二 因子 得 分 | 第 三 因子 得 分 | 第 四 因子 得 分 下 
1992 2.708 0. 413 一 0. 933 一 0. 945 1. 596 
1993 2. 709 一 0. 551 一 0. 413 一 0. 852 1. 421 
1994 0. 794 一 529 一 0. 491 1. 000 0. 166 
1995 0.275 一 0. 886 一 0. 918 0. 180 一 0.099 
1996 一 0. 096 一 和 2 一 0.751 一 0. 354 ald 
1997 一 0. 631 一 1.021 一 0.471 一 0. 296 一 0. 683 
1998 一 1198 一 1166 一 0. 257 一 0.872 一 1.089 
1999 一 1.093 一 1 337 0. 235 一 0. 908 一 1.028 
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( 续 ) 
年 度 第 一 因子 得 分 | 第 二 因子 得 分 | 第 三 因子 得 分 | 第 四 因子 得 分 F 

2000 一 0.870 一 1. 142 0. 855 —0. 391 —0.756 
2001 一 0. 432 一 0.591 0. 597 一 0. 543 一 0. 394 
2002 一 0.569 一 0. 443 一 0. 468 0. 245 一 0. 468 
2003 一 0. 208 一 0. 609 一 0. 506 1. 324 一 0. 206 
2004 =0;215 0.393 一 和 731 1. 452 0.014 
2005 一 0.069 0. 661 一 0. 421 0. 259 0. 098 
2006 0. 227 0. 936 0. 020 1. 499 0.474 
2007 0. 870 一 0. 050 3.535 Kx 0. 883 
2008 一 0.313 0. 882 一 0.056 《SGSN oa86 0. 048 
2009 0. 109 0. 289 1. 420: sa 663 0. 197 
2010 0.121 0. 676 CN —0. 008 0. 310 
2011 一 0. 183 1.079 AS 5 一 0.283 0.141 
2012 一 0. 597 1.53 # 上 一 0. 428 一 0.034 一 0. 044 
2013 一 0.672 eR —0.957 | 1.376 —0.062 
2014 —0.668 ll “er —0. 138 —2. 682 一 0. 203 





» E 1 4 
回 届 吧 回 (2) a in 人， 预警 ， 建 立 金融 风险 的 
[EE 综合 防范 体系 。 另 一 方面 ， 要 建立 我 国 金 融 风险 的 转移 体系 。 风 险 转移 是 通 
ep 二 建立 存款 保险 公司 的 方式 ? 当 爹 融 机 构 倒闭 时 ， 由 存款 保险 公司 对 存款 人 
区 关于 Ne 


本 章 小 结 





主 成 分 分 析 和 因子 分 析 都 是 用 于 将 多 个 相关 变量 简化 为 少数 几 个 综合 指标 的 多 元 
统计 分 析 方法 ， 可 以 在 尽 可 能 保留 变量 信息 的 基础 上 降低 变量 维 数 。 因 子 分 析 是 在 主 
成 分 分 析 的 基础 上 进一步 研究 主 成 分 与 变量 间 的 关系 ， 分 析 影响 原 变量 的 共同 因素 与 


特殊 因素 ,进一步 简化 原来 变量 的 维 数 和 结构 。 这 两 种 方法 用 途 非 常 类 似 ， 但 也 存在 
着 很 大 的 不 同 ， 在 应 用 时 要 注意 区 分 。 





关键 术语 


Principal component analysis “ 主 成 分 分 析 Principal components 主 成 分 
Correlation matrix 相关 算 阵 Unrotated factor solution 非 旋转 因子 
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主 成 分 与 因子 分 析 
Scree plot 碎 石 图 Covariance matrix 协 方差 矩阵 
Factor score coefficient matrix 因子 得 分 系数 矩阵 
Unweighted least squares 未 加 权 最 小 平方 ”Alpha factoring a 因子 
Image factoring 映像 因子 Generalized least squares 综合 最 小 平方 
Maximum likelihood 最 大 似 然 估计 Principal axis factoring ”主轴 因子 
Factor analysis 因子 分 析 


:他 知识 链接 


[1] 何 晓 群 . 多 元 统计 分 析 [MJ 2 版 .北京 ， 中国 人民 大 学 出 版 社 ，2008. 
[2] 中 华人 民 共和 国 统计 局 网 站 ，http。//www stas. gov en. 
[3] 地 金龙 ， 李 妍 ， 郑 雪 仪 .SPSS 统计 学 实验 教程 FM]， 北 京 ; Re 2015. 


一 、 选 择 题 >、 
1. 主 成 分 的 协 方差 阵 为 ( )。 /下 
A. 元 素 都 相同 B. 对 角 和 二 - C. 单位 矩阵 D. 任意 矩阵 


2 二 成分 表 区 系数 向) 的 和 全 向、 帝 
A. 原始 资料 矩阵 -如 了 协 差 拭 阵 尽 相关 系数 矩阵 D， 以 上 者 不 是 


3 pe 转化 为 均值 、 方 差分 别 为 ( 。“，) 的 标准 值 


B. 1, 0 Se 0 Ds 1 


A. 0,1 > 入 | 
4. SPSS 中 主 成 分 分 析 采 用 ( ) 命 人 
A. analyz ta reduction ~ factor 


Ef : : 
B. analyze - data reduction - optimal scaling 
C. analyze - data reduction ~ correspondence analysis 
D. analyze ~ classify - tree 


5. 变量 共同 度 是 指 因子 载荷 矩阵 中 ( 号 


A. 第 i 行 元 素 的 和 B. 第 i 列 元 素 的 和 

C. 所 有 元 素平 方 和 D. 第 ; 行 元 素 的 平方 和 
6. 公共 因子 方差 与 特殊 因子 方差 之 和 为 (  ) 。 

A. 1 B. 0 [2 D. 3 
二 、 简 答题 


1. 主 成 分 分 析 的 几何 意义 是 什么 ? 

2. 什么 是 主 成 分 的 方差 贡献 率 和 累计 方差 贡献 率 ? 其 实际 意义 何在 ? 
3. 在 进行 主 成 分 或 因子 分 析 之 前 ,为 什么 要 标准 化 数据 ? 

子 分 析 模 型 与 主 成 分 分 析 模 型 有 何不 同 ? 

子 分 析 模 型 与 回归 分 析 模 型 有 何不 同 ? 

子 载荷 阵 的 统计 意义 是 什么 ? 


函 








国外 





-2 
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7. 因子 旋转 的 目的 是 什么 ? 
8. 主 成 分 分 析 与 因子 分 析 有 何 作用 ? 
9. 在 某 大 学 一 年 级 44 名 学 生 的 期 末 考 试 中 ， 线 性 代数 和 概率 统计 课程 采用 闭卷 考试 ， 
法 律 、 思 想 品德 和 C 语言 程序 设计 课程 采用 开卷 考试 ， 考 试 成 绩 见 表 8 -28。 
表 8-28 某 大 学 44 名 学 生 的 考试 成 绩 





























线性 | 概率 | 入 | 思想 dg 线性 | 概率 | 和 | 思想 2 
代数 | 统计 镇 | ii | 代数 | 统计 电信 | 和 
人 82 67 67 81 63 78 80 70 81 





























51 67 65 65 68 59 68 62 56 
62 60 58 62 70 8 72 60 62 45 
52 64 60 63 54 _ XN 67 59 62 44 
50 50 64 55 时 长 65 63 58 56 37 
31 55 60 57 A 60 64, 56 54 40 
44 69 53 5 ss 42 演 61 55 45 






































32 | 
12 上 I 63 厂 时 49 53 49 62 47 
54 497 56 47 53 54 53 46 59 44 
44 56 55 61 36 18 44 50 57 81 
46 52 65 50 35 32 45 49 57 64 
30 69 50 52 45 46 49 53 59 37 
40 27 54 61 61 31 42 48 54 68 
36 59 51 45 51 56 40 56 54 35 
46 56 57 49 32 45 42 55 56 40 
42 60 54 49 33 40 63 53 54 25 
23 55 59 53 44 48 48 49 51 37 
41 63 49 46 34 46 52 53 41 40 
































采用 SPSS 统计 软件 中 的 因子 分 析 功 能 对 这 组 数据 进行 因子 分 析 ， 得 到 表 8 - 29 和 
表 8-30 所 示 的 输出 结果 。 


第 8 章 








主 成 分 与 因子 分 析 | 313 








表 8 -29 Total Variance Explained 


















































Extraction Sums of Rotation Sums of Squared 
Tnitial Eigenvalues 
Squared Loadings Loadings 
Component 
% of |Cumulative % of |Cumulative % of | Cumulative 
Total Total Total 
Variance % Variance % Variance % 
1 2.612| 52.239 52.239 |2.612| 52.239 52.239 |1.893| 37.851 37.851 
2 1.072| 21. 441 73.680 |1.072| 21.441 73.680 |1.791| 35.830 73. 680 
3 .569 | 11.389 85. 069 
4 .436 8.719 93.788 
5 。311 6.212 100. 000 | 入 


表 8-30 Rotated Component M EAN 
R 王 Component 
指 标 




















4 
Kr ; 
线性 代数 > .055 .856 
概率 统计 EX .188 .780 
法 律 ,> \ -5 、 .564 
思想 品德 > a 时 YT . 360 
C 语言 程序 设计 ,X29 一 .063 











2 入 | r RS 7 

(1) 解释 表 8、39 中 各 列 的 含义 ， 关机 据 去 8 - 29 中 的 数据 信息 说 明 最 终 提取 几 个 公 
共 因 子 ， 能 反 信息 的 百分比 。 原 有 信息 的 百分比 是 多 少 ? 

(2) 根据 表 8 - 30 中 的 数据 信息 ， 对 所 提取 的 公共 因子 进行 合理 的 命名 ， 并 说 明 命名 
的 依据 。 

三 、 判 断 题 

1. 主 成 分 分 析 中 ,各 主 成 分 之 间 应 该 相关 。 

2. 主 成 分 分 析 中 ， 每 一 个 主 成 分 应 是 各 原始 变量 的 一 些 特殊 的 线性 组 合 。 

3. 主 成 分 分 析 的 过 程 实际 是 坐标 系 旋 转 的 过 程 ， 各 主 成 分 表达 式 是 新 坐标 系 与 原 坐 
标 系 的 转换 关系 。 

4. 由 协 方差 阵 和 相关 阵 计 算 主 成 分 一 般 是 相同 的 。 

5. 主 成 分 分 析 中 可 以 取 累 计 方差 贡献 率 不 小 于 80% 的 前 g 个 主 成 分 或 选用 特征 值 不 
小 于 1 的 前 4 个 主 成 分 。 
6. 因子 分 析 是 将 变量 表示 为 公共 因子 的 线性 组 合 。 
7. 因子 分 析 中 应 该 知道 每 个 公共 因子 的 实际 意义 ， 以 便 对 实际 问题 进行 分 析 。 
8. 因子 分 析 中 ， 因 子 载荷 矩阵 是 唯一 的 。 
9. 如 果 原 始 变量 本 质 上 是 独立 的 ， 也 可 以 使 用 主 成 分 分 析 和 因子 分 析 进 行 降 维 。 
10. 因子 分 析 中 因子 不 是 固定 的 ， 可 以 旋转 得 到 不 同 的 因子 。 
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四 、 计 算 题 


1. 设 总 体 X 一 (Xi .Xs)T 的 样本 协 方差 阵 为 =-|, ,| ,求生 的 主 成 分 和 Ys 并 计 


算 第 一 主 成 分 并 的 贡献 率 。 
2. 现 有 3 个 指标 Xi,X2,X3， 收集 了 n 一 29 组 数据 ， 求 得 相关 系数 矩阵 为 


1 0.8347 0.6754 
1 0. 9252 
1 


R= 








其 特征 值 为 0.6296、0. 3325、0. 0379， 对 应 的 单位 正 交 化 特征 向 量 为 


ul =(0.5498,0. 6078,0. 5730) 
uf =(—0.7788,0. 1251,0. 6147) 


=(—0. 3019,0.7842， ng 
(1) 若 要 求 累计 贡献 率 达到 90% 以 上 ， 至 少 应 取 几 不 主 分 ? 


(2) 写 出 (1) 中 提取 的 


五 、 上 机 实验 是 
1. 在 某 中 学 随机 抽取 30 rt 量 其 4 项 指标 ， 即 身高 (em)、 体 重 





E 成 分 的 表达 式 。 / 


















































(kg)、 胸 围 (ecm) 和 坐 高 (cm) ， RS ns 
表 8-3 30 名 学 生 的 四 项 测量 指标 
序号 | 身高 /cem | 体重 /kg /em | 坐 高 /em 只 体重 /kg | 胸围 /em | 坐 高 /em 
le I 
44 |, | r 1 6 

3 15& y 大 80 a 151 36 74 80 
4 15 39 68 80“ 川 19 147 30 65 75 
5 151 12 73 82 20 147 38 73 78 
6 160 47 74 87 21 156 44 78 85 
7 149 47 82 79 22 145 35 70 77 
8 137 31 66 73 23 152 35 73 79 
9 158 49 78 83 24 140 33 67 77 
10 140 29 64 74 25 161 47 78 84 
11 151 42 9 80 26 139 31 68 74 
12 153 43 76 83 27 150 43 77 79 
13 159 45 80 86 28 142 31 66 76 
14 160 49 77 86 29 149 36 67 79 
15 148 41 72 78 30 139 34 71 76 



































(1) 试用 因子 分 析 方法 确定 4 项 指标 的 公共 因子 。 
(2) 若 要 求 损失 信息 不 超过 15%， 应 取 几 个 公共 因子 ? 
(3) 对 (2) 中 所 提取 的 公共 因子 进行 解释 。 
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主 成 分 与 因子 分 析 
2. 采用 因子 分 析 方法 对 2014 年 我 国 31 个 省 市 自治 区 经 济 发 展 基本 情况 进行 综合 评 
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估 。 共 选取 8 项 指标 ， 即 国内 生产 总 值 Xi 〈 亿 元 ) 、 居 民 消 费 水 平 X* (元 )、 固 定 资产 投 

资 X; 〈 亿 元 ) 、 货 物 周转 量 X，( 亿 吨 千 米 )、 居 民 消 费 价格 指数 六; (上 年 100) 、 商 品 零 

售 价格 指数 Xs (上 年 100)、 工 业 总 产值 X7 〈 亿 元 )。 原 始 数据 资料 如 表 8 - 32 所 示 。 

表 8-32 2014 年 我 国 31 个 省 市 自治 区 经 济 发 展 基本 情况 
序号 省 份 x xX Xs Xs Xs Xe X7 

1 北京 “| 21330.83 | 13329.2 | 6924.2 | 1036.71 101.6 99.1 3746. 77 
2 天 津 “|15726.93 | 6253.6 | 10518.2 | 3602.38 | 101.9 100.9 7079. 1 
3 河北 29421.15 | 12539 26671.9 | 12684.47 | 101.7 101.1 13330. 66 
4 山西 “| 12761.49 | 6365.6 | 12354.5 | 3710.81 | 101.7 100.6 5471. 01 
5 内 蒙古 | 17770.19 | 7158.2 | 17591.8 | 4471.08 2 100.7 7904. 4 
6 辽宁 | 28626.58 | 12192.7 | 24730.8 Ye 101 12656. 83 
7 吉林 | 13803.14 | 5408 11339.6 | 1703: 1* 102 101.2 6424. 88 
8 黑龙 江 | 15039.38 | 8877.3 9829 AH 101.5 100.8 4783. 88 
9 上 海 23567.7 | 13858.1 | 6016.4 33.36 | 102.7 100.9 7362. 84 
10 江苏 ”| 65088. 32 | 31067.3 2 110417. 86 | 102.2 101.6 | 26962.97 
11 浙江 | 40173.03 | 19365. 4 2 8 | 9539.7 102.1 100.9 16771.9 
12 安徽 ”| 20848.75 | 101 | 1857.6 | 13500.6-| 101.6 100.4 9455. 48 
13 福建 24055. 76) i 18177. 9 wi 102 101.1 10426. 71 
14 江西 “| 15714,63139082.6 | 15079.3 |3482%998 | 102.3 101.2 6848. 63 
15 山东 “| 59426 59*| 24193. 1 | 42495. 101.9 101 25340. 86 
16 河南 Ra 24 | 16850.1 sz D 7401.12 | 101.9 101 “| 15809.09 
17 > 27379.22 | 12562.8 | 229Y5.3 | 5503.57 102 100.9 | 10992.79 
18 27037. 32 | 12463.1 | 21242.9 | 4138.36 | 101.9 101.2 | 10749.88 
19 广东 | 67809.85 | 33920.6 | 26293.9 | 14801.03 | 102.3 101.4 | 29144.15 
20 广西 “| 14672.89 | 8187.7 | 13843.2 | 4089.65 | 102.1 101.2 6065. 34 
21 海南 3500.72 | 1722.7 | 3112.2 | 1488.1 102.4 100.9 514. 4 
22 重庆 14262.6 | 6764.7 | 12285.4 | 2594.96 | 101.8 100.6 5175.8 
23 四 川 28536. 66 | 14529.9 | 23318.6 | 2465. 13 101.6 101.2 11851. 99 
24 贵州 9266. 39 | 5288.5 | 9025.8 | 1441.78 | 102.4 101.6 3140. 88 
25 云南 “| 12814. 59 | 8207.5 | 11498.5 | 1445.58 | 102.4 102.2 3898. 97 
26 西藏 920. 83 595.2 1069.2 | 110.38 102.9 100.7 66. 16 
27 陕西 “| 17689.94 | 7816.1 | 17191.9 | 3521.46 | 101.6 101.7 7993. 39 
28 甘肃 6836.82 | 4035.6 | 7884.1 | 2515.47 | 102.1 101.5 2263. 2 
29 青 2303.32 | 1154.4 | 2861.2 | 506.94 102.8 100.9 954. 27 
30 宁夏 2752. 1 1468.6 | 3173.8 | 836.84 101.9 101.7 973. 53 
31 新 疆 9273. 46 | 5024.5 9447.7 | 1880.92 102. 1 101.3 3179.6 


























资料 来 源 :《 中 国 统计 年 鉴 (2015))。 
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3. 消费 结构 是 指 人 们 在 生活 中 消费 的 消费 资料 和 接受 的 服务 种 类 及 其 比例 关系 ， 也 
就 是 指 各 类 消费 支出 在 总 消费 支出 中 的 比例 ， 对 居民 消费 支出 按照 人 们 实际 支出 的 去 向 分 
类 可 分 为 吃 、 穿 、 用 、 住 、 文 化 娱乐 等 ， 按照 我 国 常用 的 消费 资料 支出 分 类 方法 ， 将 城镇 
居民 人 均 生 活 费 支出 分 为 食品 、 衣 着 、 居 住 、 家 庭 设备 及 服务 、 医 疗 保健 、 交 通通 讯 、 文 
教 娱乐 及 服务 、 杂 项 商品 及 服务 8 个 部 分 ， 他 们 在 人 均 生 活 费 支 出 中 所 占 的 比例 分 别 记 为 
Xi,X:,…,Xs 。 试 根据 浙江 省 城镇 居民 家 庭 生活 的 抽样 调查 资料 〈( 表 8 - 33)， 采 用 因子 
分 析 方 法 研究 居民 消费 结构 变化 。 











表 8-33 2005 一 2012 年 浙江 省 城镇 居民 人 均 生 活 消费 支出 构成 (单位 : %) 
年 份 Xi XX Xs Xs Xs Xe xX Xs 
2005 33.78 10. 31 8. 64 4.97 6.79 17. 1F 15. 10 3.28 
2006 32. 91 10. 37 9.21 4. 61 6.38 | AI PN 14.58 dy 








2007 34.72 9.98 8. 29 4.73 6.1 NY 55 15. 31 3.32 
SH 9 


2008 36.44 | 10.20 8. 80 or | Ne 15.79 | 14.49 3.44 
2009 33. 60 9.68 8. 91 4. 97 WN 00 19.73 13. 76 3.47 






































2010 34. 26 10. 09 7.94 SS 5. 79 19. 25 14. 48 3.06 
2011 34.57 10.47 7.43 3 6. 11 18. 24 13.78 3.97 
2012 35.05 0.79 :20 \| 5.39 5.70 Wh 19.19 13.91 3.77 








资料 来 源 ， 《浙江 统计 年 至 01 ,XX 
实际 操作 训练 


1 实 训 奔 前 注 成 分 分 析 法 在 学 生成 绩 评价 中 的 应 用 

实 训 目 的 学 会 运用 主 成 分 分 析 的 原理 和 方法 解决 实际 问题 。 

实 训 内 容 ， 通 党 情况 下 ， 学 校 在 评价 学 生成 绩 时 ， 主 要 采取 的 是 多 门 课程 总 平均 分 排名 
的 方法 。 这 种 方法 对 学 生成 绩 评价 过 于 笼统 ， 看 不 出 学 生 在 各 学 科 间 的 优势 与 劣势 为 了 解 
决 传统 评价 方法 中 的 缺 险 ， 可 使 用 主 成 分 分 析 法 来 对 学 生成 绩 进行 科学 的 评价 和 学 科 间 具体 
的 优势 劣势 的 度量 。 请 收集 所 在 班级 学 生 的 上 一 学 年 的 考试 成 绩 ， 对 其 进行 主 成 分 分 析 。 

要 求 ， 

Q) 技 出 影响 学 生 综合 得 分 的 主要 因素 。 

(2) 对 比 用 主 成 分 分 析 得 到 的 综合 得 分 排名 与 按 平均 分 排名 ， 从 中 找 

出 在 课程 学 习 中 的 间 题 加 以 改进 。 

2. 实 训 项 目 ， 我 国 各 地 区 财政 支出 的 因子 分 析 

实 训 目 的 ， 学 会 运用 因子 分 析 的 原理 和 方法 解决 实际 问题 。 

实 训 内 容 : 我 国 各 地 区 主要 财政 支出 项 目 包 括 一 般 公共 服务 、 国 防 、 公 共 安 全 、 教 
育 、 科 学 技术 等 14 项 。 请 查阅 《中 国 统计 年 鉴 )， 获 取 2008 年 的 相关 数据 ， 对 这 14 个 变 
量 做 因子 分 析 ， 将 这 14 个 变量 综合 为 少数 几 个 因子 ,通过 对 各 地 区 的 每 个 因子 得 分 的 分 
析 了 解 各 地 区 财政 支出 情况 ， 为 更 为 合理 地 安排 财政 支出 提供 依据 。 
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要 求 : 对 我 国 各 地 区 的 财政 支出 进行 因子 分 析 ， 并 对 结果 做 出 合理 的 解释 。 

3. 实 训 项 目 : 我 国 各 地 区 农业 发 展 状况 研究 

实 训 目的 : 学 会 运用 因子 分 析 的 原理 和 方法 解决 实际 问题 。 

实 训 内 容 : 改革 开放 以 来 ,我 国 的 经 济 有 了 长 足 的 发 展 ， 尽 管 农业 在 国民 经 济 中 的 比例 
逐年 下 降 ， 但 农业 的 基础 性 作用 越 来 越 重要 。 由 于 受 自然 环境 、 人 口 分 布 等 因素 的 影响 ， 我 
国 各 地 区 之 间 的 农业 发 展 水 平 并 不 十 分 平衡 。 请 查阅 《中 国 农业 统计 年 鉴 》， 获 取 2008 年 的 
相关 数据 ， 选 取 农业 人 口 、 耕 地 面积 、 农 药 使 用 量 等 9 个 指标 分 析 不 同 地 区 间 的 农业 差异 。 

要 求 : 

(1) 利用 因子 分 析 的 结果 对 相关 经 济 现象 做 出 合理 的 解释 。 

(2) 探讨 我 国 各 地 区 农业 发 展 水 平 的 差异 及 其 产生 的 原因 。 


[和 宁 例 思考 与 讨论 论 
(XN 
ET 


在 上 市 公司 经 营业 绩 综 合 评价 过 程 中 ， 评价 指 杭 的 选取 是 否 合 和 过 ， 直 接 影响 综合 评价 
结论 。 科 学 的 综 ed alert tna de 
petty 指标 选取 过 多 ， 会 产生 许多 重复 性 指标 ， 相 互 之 间 产 生 干 扰 ， 对 综合 评价 
有 不 利 影响 ， 指 标 选取 太 少 ， 所 选 据 械 环 能 缺乏 足够 的 代表 性 ， 会 产生 片面 性 。 所 以 ， 如 
何 科学 地 选择 指标 ， 构建 指标 体系 江 是 上 市 公司 经 经 营业 续 绽 从 评价 中 首先 要 解决 的 问题 。 

上 市 公司 经 营业 绩 综 合 评 体 指标 的 镍 选 必须 采用 二 客 疡 咎 结合 的 方法 ， 在 充分 发 挥 主 
观 能 动 性 ， 即 对 上 市 公 经 营业 呈 评 价 本 质 认识 的 时 大 止 ， 再 结合 适当 的 统计 学 方法 来 进 
行 。 指 标 币 选 方法 的 思路 和 步骤 如 下 : 更 N 

(1) 根据 经 济 意 及 理 行 指标 分 类 ， 众生 市 公司 经 营业 绩 的 内 涵 出 发 ， 对 主要 综合 评价 
指标 按照 指标 交 经 济 意义 进行 分 类 《可 在 入 “金融 界 ” 网 站 www. jtj. com. en 公布 的 财 
务 分 析 指标 、 国 有 资本 爹 绩效 评价 指标 及 “证 星体 系 ”评价 指标 的 基础 上 ， 对 上 市 公司 业 
绩 评 价 指标 按 盈 利 能 力 、 经 营 效率 、 成 长 能 力 、 偿 债 能 力 4 个 方面 进行 分 类 ) 。 

(2) 对 每 类 中 的 指标 再 进行 R 型 聚 类 分 析 ， 将 其 分 成 若干 子 类 。 

(3) 在 子 类 中 运用 统计 学 方法 选择 代表 性 指标 。 若 某 个 子 类 只 要 一 个 指标 ， 则 将 其 直 
接 选 入 评价 指标 体系 ; 若 某 子 类 有 两 个 以 上 的 指标 ， 则 计算 该 子 类 中 各 指标 与 其 他 指标 的 
复 相关 系数 。 某 指标 的 复 相关 系数 在 该 类 越 大 ， 则 可 认为 该 指标 所 包含 本 类 的 信息 最 丰 
富 ， 对 该 类 指标 的 代表 性 最 强 ， 按 此 推理 ， 复 相关 系数 最 大 的 指标 入 选 。 

请 采用 湖南 35 家 上 市 公司 20 项 业绩 评价 指标 数据 进行 分 析 。 数 据 可 从 各 上 市 公司 
2015 年 年 报 中 获得 。 要 求 : 

@ 运用 R 型 聚 类 方法 对 上 市 公司 经 营业 绩 评价 指标 进行 御 选 。 

加 运用 因子 分 析 方 法 对 上 市 公 司 经 营业 绩 进行 综 合 评价 。 
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对 应 分 析 


| «oD ,人 
通过 本 章 的 学 习 ， 正 确 理解 对 应 分 析 的 基本 原理 和 方法 ea 
又 及 SPSS 软件 的 操作 步骤 ， 学 会 利用 对 应 分 析 方 法 解 ; 


| «enD KK 





知识 要 点 能 力 相关 知识 
SN 
对 应 分 析 的 原理 和 sew 的 基本 思想 及 基 | 数据 变换 方法 、R 型 与 Q 型 因子 
方法 本 步骤， Sy 
L x 


和 
一 计算 规格 化 的 概率 矩阵 P， 计算 过 
对 应 分 析 的 基本 计 仆 人 和、 的 四 进行 因子 分 析 ， 








算 步 又 计 淫 本 计算 步骤 六 以 
NO Ek 5 分 布 图 
能 够 熟练 使 用 SPSS 软件 之 对 应 分 析 “Correspondence Analysis ”对 
SPSS 软件 操作 
功能 并 对 输出 结果 进行 正确 解读 话 框 











主 成 分 分 析 、 因 子 分 析 、 变 量 (指标 ) 聚 类 分 析 都 是 研究 变量 之 间 的 相互 关系 。 而 错 综 复 
的 经 济 和 管理 关系 中 ,不 仅 需 要 了 解 变量 之 间 的 关系 ,还 需要 了 解 样品 之 间 的 关系 ， 尤其 需 
要 了 解 变量 与 样品 之 间 的 对 应 关系 。 不 仅 如 此 ， 人 们 往往 还 希望 能 在 同一 个 直角 坐标 系 内 同时 
表达 出 变量 与 样品 两 者 之 间 的 相互 关系 。 对 应 分 析 (Correspondence Analysis) 就 是 实现 这 一 
目的 的 有 效 方法 。 
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我 国 农村 居民 消费 结构 与 地 域 的 对 应 关系 


农民 消费 结构 状况 在 一 定 意义 上 影响 着 农村 社会 的 发 展 。 研 究 促进 经 济 增长 的 重要 力量 之 一 的 消费 
问题 十 分 重要 ， 而 分 析 消 费 结构 有 助 于 把 握 消费 的 总 体 状 况 。 农 民 的 消费 支出 构成 是 衡量 农民 消费 结构 
的 重要 指标 。 在 通常 情况 下 ， 研 究 农民 的 各 项 生活 消费 支出 ， 重 点 包括 食物 消费 支出 、 交 通通 信 支 出 、 
文教 娱乐 用 品 及 服务 支出 和 医疗 保健 支出 ， 有 助 于 衡量 农民 生活 现代 化 的 水 平 。 

消费 水 平 是 衡量 一 个 地 区 乃至 一 个 国家 经 济 实力 的 重要 指标 之 一 ， 由 于 中 国 幅员 辽阔 ， 各 地 经 济 改 
展 水 平 不 同 、 文 化 风俗 不 一 ， 人 们 对 消费 的 偏好 不 同 ， 所 以 支出 也 不 尽 相 同 从 “三 农 ”( 农 业 、 农 村 、 农 
民 ) 问题 是 目前 我 国 非常 重要 的 问题 ， 也 是 广大 人 民 群 众 十 分 关注 的 问题 人 Ni 和 研究 各 地 区 农村 居民 
家 庭 消费 支出 的 不 同 特点 ， ei 它 有 助 于 有 的 放 矢 地 制定 
出 更 加 合理 的 政策 ， 减 小 政策 在 制定 和 实施 中 的 盲目 性 ， 对 我 国 的 经 济 发 展 、 扩 大 需要 和 提高 人 民生 活 
水 平 具有 重要 的 指导 意义 。 2 

那么 ， NE 从 消费 结构 是 否 可 以 看 出 位 
于 不 同 地 域 的 农民 生活 消费 支出 的 变化 情况 ? 六 








农民 的 消费 支出 结构 除了 受 之 外 ， 也 从 另外 一 个 侧面 反映 了 农民 的 收入 之 
re re 
背后 的 原因 ， 以 期 能 在 经 济 厅 断 发 展 的 今天 ， 找 出 5: 定 的 消费 规律 性 ， 并 由 此 提出 一 些 建 
议 。 然 面 在 现实 生活 中 心绪 种 仅 任 经验 和 专业 知识 做 定性 分 类 的 方法 已 不 能 满足 实际 和 震 
要 ， 我 们 必须 将 定性 入 定 宪 分 析 结 全 起 来 分 类 。 风 此 ， 采 用 对 应 分 析 来 对 这 一 类 定 基 变 让 


OO 


新 产品 名 称 的 测试 


对 新 产品 来 说 ， 产 品名 称 是 消费 者 认识 和 识别 该 产品 的 核心 要 素 ， 是 形成 品牌 概念 的 基础 。 为 新 产 
品 起 一 个 好 的 名 字 是 非常 重要 的 ， 好 的 名 字 至 少 应 满足 下 列 两 个 条 件 : 

(1) 名 字 应 该 使 消费 者 联想 到 正确 的 产品 。 

(2) 名 字 应 该 使 消费 者 产生 与 正确 产品 密切 相关 的 联想 。 

中 美 纯 水 有 限 公 司 欲 为 其 新 推出 的 一 种 纯 水 产品 起 一 个 合适 的 名 字 ,， 为 此 专门 委托 了 当地 的 策划 次 
询 公 司 ， 取 了 一 个 名 字 “ 波 澜 "。 后 来 中 美 纯 水 有 限 公司 又 委托 调查 统计 研究 所 ， 进 行 了 一 次 全 面 的 市 场 
研究 。 该 统计 研究 所 将 拟定 中 的 新 产品 名 称 “波澜 ” 同 其 他 7 个 模拟 的 名 称 一 起 测试 。 问 卷 中 的 问题 
如 下 : 

(1) 请 您 判断 一 下 它们 最 像 什么 商品 的 名 称 ? (出 示 卡 片 ， 只 选 一 项 ) 

@ 雪糕 四 纯 水 图 碳酸 饮料 图 果汁 饮料 

回 保健 食品 @ 空调 @ 洗衣 机 。 轿 毛 毯 回 其 他 
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(2) 这 些 名 称 最 能 使 您 产生 什么 感觉 ? (出 示 卡 片 ， 只 选 一 项 ) 

加 清爽 回 甘 大 图 欢快 ”图 纯净 

回 安 闲 ”加 个 性 加 兴奋 加 高 档 四 其 他 

该 统计 研究 所 经 过 调查 研究 ， 需 要 解决 的 问题 是 : 为 纯 水 起 名 为 “波澜 ”恰当 么 


在 新 产品 名 称 测试 的 研究 实践 中 ， 我 们 往往 遇 到 的 问题 就 是 一 个 新 产品 的 问世 到 底 该 
起 一 个 什么 名 字 为 好 ， 这 个 名 字 对 于 消费 者 能 产生 什么 感觉 ? 以 往 在 分 析 时 只 是 通过 交叉 
国术 We 国 。 列表 来 表现 产品 、 名 称 、 感觉 之 间 的 关系 。 如 果 仅 仅 是 两 个 变量 ， 且 每 个 变 
= 量 类 别 较 少时 表现 得 比较 清楚 ， 但 在 每 个 变量 划分 有 多 个 类 别 的 情况 下 就 很 
a 难 直 观 地 揭示 出 变量 之 间 的 内 在 联系 。 近 年 来 ， 对 应 分 析 方 法 的 运用 则 有 效 
【期 刊 推荐 】 ”地 解决 了 这 些 定性 变量 的 分 类 和 对 应 问题 。 从 


9.1 对 应 分 析 概述 ， 
ms 
所 本 
9.1.1 问题 的 提出 SS- 
A 

在 实际 数据 的 统计 分 析 中 经常 要 处 引 3 各 关系 ， 即 变量 之 间 的 关系 、 样 品 之 间 的 
关系 及 变 其 和 样品 之 问 的 关系 。 例 如 X_ 对 任国 各 高 校 进行 教学 评估 时 ， 不 仅 要 研究 教学 
评估 指标 间 的 关系 ， 还 要 将 高 校 按 教学 评估 结果 进行 分 类 3 研究 哪些 高 校 与 哪些 教学 评 
估 指 标的 关系 密切 一 些 ， 为 各 级 领导 部 门 制定 科学 的 痰 第 据 供 参考 依据 。 这 就 需要 有 一 
种 方法 ， 将 教学 评估 指标 和 高 校 放 在 一 起 进行 综合 分析 对 应 分 析 就 是 研究 这 类 问题 的 
统计 方法 。 -去 】 SN 

对 应 分 析 实 际 是 因子 分 析 的 进一步 失 户 在 内 子 分 析 中 ， 我 们 重点 介绍 如 何 将 多 个 变 
最 归结 为 少数 沈 个 综合 因子 ， 即 研究 对 象 是 指标 ， 所 用 的 方法 也 可 称 为 R 型 因子 分 析 。 但 
是 在 实际 问题 中 ， 这 样 的 分 析 方法 有 它 的 局 限 性 ， 主 要 体现 在 以 下 两 点 ; 

(1) 如 果 研究 的 对 象 是 样品 ， 我 们 也 可 以 采用 类 似 于 R 型 因子 分 析 的 方法 做 类 似 的 处 
理 ， 我 们 可 称 之 为 Q 型 因子 分 析 。 但 是 ， 由 于 在 统计 分 析 中 ， 样 品 的 个 数 远 远 大 于 变量 的 
个 数 ， 这 样 给 Q 型 因子 分 析 带 来 了 极 大 的 困难 。 例 如 ， 有 200 个 样品 ， 每 个 样品 测 20 项 
指标 ， 要 做 R 型 因子 分 析 ， 需 要 计算 20X 20 阶 相似 系数 矩阵 的 特征 值 和 特征 向 量 ;而 要 
做 Q 型 因子 分 析 ， 则 需要 计算 200X200 阶 相 似 系数 矩阵 的 特征 值 和 特征 向 量 。 

(2) 在 民 型 因子 分 析 中 ， 为 了 去 掉 变量 量 纲 的 影响 ， 我 们 往往 对 变 其 进行 标准 化 处 
理 。 然 而 这 种 标准 化 对 样品 就 不 好 进行 了 。 也 就 是 说 ， 这 种 标准 化 处 理 对 于 变量 和 样品 是 
非 对 等 的 ， 这 给 R 型 和 Q 型 因子 分 析 之 间 的 联系 带 来 障碍 。 

对 应 分 析 是 将 R 型 因子 分 析 与 Q 型 因子 分 析 结合 起 来 进行 的 统计 分 析 方法 ， 它 可 以 
从 R 型 因子 分 析 的 结果 出 发 ， 很 容易 得 到 Q 型 因子 分 析 的 结果 。 对 应 分 析 不 仅 适用 于 数 
量 型 变量 ， 而 且 还 适用 于 品质 型 变量 。 更 重要 的 是 ， 它 可 以 把 变量 和 样品 反映 在 相同 坐标 
轴 的 一 张 图 形 上 ， 这 样 就 把 变量 和 样品 联系 起 来 ， 便 于 解释 和 推断 。 概 括 起 来 。 对 应 分 析 
可 以 通过 同一 张 图 形 反映 如 下 3 方面 的 信息 : 

(1) 反映 变量 之 间 的 关系 。 图 形 上 邻近 的 变量 点 表示 变量 问 关系 密切 。 
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(2) 反映 样品 之 间 的 关系 。 图 形 上 邻近 的 样品 点 具有 相似 性 质 ， 可 以 认为 属于 同 

一 类 。 
(3) 反映 变量 与 样品 之 间 的 关系 。 同 一 类 型 的 样品 点 被 邻近 的 变量 所 表征 。 


镶 阅读 专栏 9- 1/ 
“对 应 分 析 ” 方 法 的 产生 


对 应 分 析 的 最 早 的 英 基 性 工作 出 现 于 20 世纪 30 年 代 。 

Richardson 和 Kuder 在 1933 年 首先 提出 了 互 平均 法 包含 了 对 应 分 析 的 基本 思想 ,缺点 是 他 们 在 计 
dene Horst 在 1935 年 进 一 步 明确 了 互 平均 方法 的 最 优化 原则 ， 改进 了 前 者 的 计算 方 

， 把 它 用 于 二 态 变量 ， 以 后 又 把 这 种 方法 用 于 连续 变量 。Hirschfeld 在 193& 年 提出 协同 线性 回归 准则 ， 
AR 元 随机 变量 的 分 布 求 变量 值 ， SN 式 求 出 的 解 ， 正 是 对 应 
分 析 的 解 。 

有 趣 的 是 这 些 工作 一 直 没 有 引起 人 们 的 注意 。 在 以 后 的 sa ee 
这 方面 的 研究 ， 独立 地 提出 了 许多 表面 上 不 同 实质 上 等 价 4 kt 准则 和 计算 方法 。 这 里 仅 列 出 其 中 的 
某 些 重要 工作 。 NS 

Fisher 在 1940 年 研究 人 的 眼睛 颜色 与 头发 颜 多 ， 求 出 关于 两 个 定性 变量 的 两 组 得 分 ， 所 用 
的 方法 就 是 前 边 所 说 的 互 平均 ， 他 还 指出 ， es -2 ds 
定性 变量 二 维 表 的 相关 性 度量 问题 ， 为 出 了 3 个 等 价 的 准则 ， 即 求 出 行 和 列 的 得 分 ,使 能 极 

大 化 。 同 一 年 ， Guttman 在 研究 乡 重 旋 * 用 内 部 一 ele dd 求 诸 变 量 的 
权 ， 以 使 样品 内 部 高 差 平方 和 与 可 本 下方 和 之 比 极 小儿 X 年 首次 把 这 大 ,方法 用 于 研究 成 对 比 
较 数据 和 秩 顺 序数 据 ， 扩 展 渡 对 应 分 析 的 应 用 范围 。 、。“X 一 

ee CC Hayashi) 在 20 世纪 50 年 人 了 了 数量 化 理论 ， 系 统 研究 了 定性 数据 的 数量 化 

ee 准则 与 Guttman 的 将 避 二 二 致 性 准则 基本 一 致 ， 但 他 极 大 地 推广 了 Guttman 的 














a i 数据 的 多 维 数量 化 方面 。 和 Fisher 和 Maung 的 对 应 应 分 析 模 型 ，Williams 1952 年 
参考 判别 分 析 给 出 了 假设 检验 方法 。Lancaster 在 1953 年 研究 了 将 娄 统 计量 用 于 假设 检验 的 方法 。 

至 此 ， 对 应 分 析 的 数学 模型 和 计算 方法 都 以 严格 的 形式 建立 起 来 了 。 自 20 世纪 60 年 代 以 后 ， 又 有 
许多 著名 的 统计 学 家 致力 于 这 方面 的 研究 。 研 究 内 容 包括 软件 开发 、 计 算 方法 的 创新 、 扩 大 应 用 范围 、 
改善 应 用 效果 等 。 这 期 间 在 理论 上 的 重要 进展 是 搞 清 了 对 应 分 析 与 其 他 多 元 统计 方法 的 关系 。 

特别 值得 注意 的 是 法 国学 者 Benzecri 等 的 工作 。 他 们 在 20 世纪 六 七 十 年 代 以 法 文 发 表 了 大 量 研究 论 
文 和 著名 的 专著 ， 又 以 数据 矩阵 的 重新 标 度 为 基础 提出 了 一 种 新 的 数学 模型 ， 首 次 采用 了 对 应 分 析 
《Correspondance Analysis) 的 名 字 。 由 于 他 们 的 工作 被 大 量 引用 ， 对 应 分 析 也 就 成 了 这 类 方法 的 比较 通 
用 的 名 字 。 

资料 来 源 : 陶 凤 梅 ， 韩 贰 ， 刘 洪 ， 等 . 对 应 分 析 数 学 模型 及 其 应 用 [MJ. 北京 科学 出 版 社 ，2008. 


9.1.2 对 应 分 析 的 基本 思想 


由 于 R 型 因子 分 析 和 Q 型 因子 分 析 都 是 反映 一 个 整体 的 不 同 侧面 ， 所 以 它们 之 间 一 
定 存在 内 在 的 联系 。 对 应 分 析 就 是 通过 一 个 过 渡 矩 阵 乙 将 两 者 有 机 地 结合 起 来 。 这 种 方法 
的 关键 是 利用 一 种 数据 变换 方法 ,使 含有 个 样品 、p 个 变量 的 原始 数据 和 矩阵 关 二 
(zi )uxp 变 成 男 一 个 矩阵 Z。 由 于 分 析 变 量 之 间 关系 的 协 方差 矩阵 R= 二 ZTZ 和 分 析 样 品 之 
间 关 系 的 协 方差 矩阵 Q 一 ZZT 具有 相同 的 非 零 特征 根 ， 可 以 很 方便 地 借助 R 型 因子 分 析 而 
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得 到 Q 型 因子 分 析 的 结论 。 对 协 方差 矩阵 RR、Q 进行 因子 分 析 ， 分别 能 提取 两 个 最 重要 的 
公 因 子 Ri 、R2 与 Qi 、Q: 及 对 应 的 因子 载荷 ， 并 且 可 以 画 出 两 个 因子 载荷 的 散 点 图 。 由 于 
这 两 个 图 所 表示 的 载荷 可 以 配对 ， 于 是 就 可 以 把 这 两 个 因子 载荷 的 两 个 散 点 图 画 到 同一 张 


图 中 ， 并 以 此 来 直观 地 显示 变量 与 样品 之 间 的 相互 关系 。 


9.2 对 应 分 析 的 原理 和 方法 






































9.2.1 对 应 分 析 中 的 数据 变换 方法 
设 有 个 样品 ， 每 个 样品 测量 p 个 变量 ,得 到 原始 数据 矩阵 为 


bk 二 上 Tp 从 


Z21 X22 Tap pg 
xX=| . . 一 (zi ) Ke KK; >0) 
日 : : Sy < 人 
mm phx 站 二 


\ \ 、 
1. 对 数据 矩阵 分 别 计算 其 行 和 、 列 和 和 总 和 性 厂 
设 w 为 第 ; 行 的 行 和 ，z .为 第 7 列 的 网 和 ”xz .为 全 部 数据 的 总 和 ， 岂 有 








su XN 
EE 
A 不 < 
式 中 , zi. = >, Zuj 一 Dz,; Ya pS 。 
i i=1 i=1j=1 


2. 将 原始 数据 矩阵 转化 为 概率 矩阵 王 


本 n bp 
设 pi 一 汪 -， 不 难看 出 ,0<<py<<1, 上 且 > > ps 一 1, 由 此 将 原始 数据 矩阵 XX 转化 
ee i=1j=1 
为 一 个 概率 矩阵 已 一 (Di ) wx 。 
pu pz … pp |Pi: 
pz pz … pzp | p2. 


bu brs | 
pr pe peplp.. 





二 
式 中 , p;. = 2)ps; py = 2 pss pb.. = 2)2)ps = 1 
jl i=1 is1j= 


因此 ，ps 可 以 解释 为 每 个 数据 x; 出 现 的 “概率 "， 概 率 和 矩阵 了 的 行 和 户 . 可 解释 为 样 
品 i 的 “边缘 概率 ”， 列 和 pp.; 可 解释 为 变量 j 的 “边缘 概率 ”。 
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3. 根据 概率 和 矩阵 卫 确 定数 据点 坐标 
如 果 我 们 将 概率 矩阵 己 中 的 ” 个 行 看 成 p 维 空间 中 的 个 样品 点 ， 则 其 个 样品 点 的 
示 可 表示 为 | 刀 ， 如 .…, 如 | (= 
坐标 表示 为 [名 ) (i=1,2,",n)。 
显然 ， 每 一 个 样品 点 的 坐标 是 各 个 变量 在 该 样品 中 的 相对 比例 ,这样 对 7 个 样品 点 的 
分 析 研究 就 转化 为 对 个 样品 点 的 相对 关系 的 研究 。 研 究 样品 点 的 相互 关系 一 般 用 两 个 样 
品 点 的 欧 氏 距离 来 描述 。 任 意 两 个 样品 点 和 k 之 间 的 欧 氏 距离 为 


p 2 
站 区 (9-1) 


pr. pr 





为 消除 各 变量 量 纲 不 同 的 影响 ， 用 系数 二 RY 


p 2 
Dr = 3 1 (名 各] S| py 二] (9-2) 
br 各 pr; Pr Vb; 


这 样 ， 就 把 个 样品 点 的 坐标 转化 为 A} 


pa biz pin ] 
， (i=1,2,°",n) 
人 bp. pi. 


p sd 
公式 (9 -2) 可 以 说 是 该 坐标 的 个 dn 上 与 人 之 间 的 欧 氏 距离 ， 通 过 
计算 两 两 样品 点 之 间 的 距离 ， 可 以 实现 对 样品 点 的 分 类 光 入 | 、 
类 似 地 ， 可 以 将 个 变 世 夺 朋 1 维 空 间 的 点 ,所 
人 全- 
NA pi. pi KP YY 9 人 
表示 了 We 二 的 和 之 间 的 欧 氏 眶 离 为 
































SS bn pn 
D2?(i,j) = i 《9 一 3) 
b= | 
通过 计算 两 两 变量 之 间 的 距离 ， 可 以 实现 对 变量 的 分 类 。 
4. 计算 协 方差 矩阵 
通过 计算 欧 氏 距 离 可 以 对 样品 进行 分 类 ， 也 可 以 对 指标 进行 分 类 ， 但 是 它 无 法 反映 样 
品 和 指标 之 间 的 关系 。 为 此 ， 需 要 给 出 计算 样品 点 的 协 方差 矩阵 和 计算 变量 点 的 协 方差 
矩阵。 
1) 计算 变量 点 的 协 方差 矩阵 
pa bi ee bip 
旋 .1 pi. Vb.2 pi. VPb.p 








由 第 i 个 样品 的 项 变量 观测 值 ( 
出 发 ， 则 第 7 个 变量 的 均值 为 


p; > 
op. py = VP (9 -4 
2 Bi bs VP = 


第 i 个 变量 与 第 j 个 变量 的 协 方差 为 
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a py ] 
a Vb.i vp. lg 
" 2 搬 es VD 人 
和 径 — pipr. se 三 六 DE 
k=1\ Vb.ibr. Vb.ibr. 
= 之 /zz 
k=1 
式 中 ， 

Th Bs Ws 
bu—p.ibr. _+ 工 Wi Hs 
< 

pk Th 也 ZK。 
Or 
EI SR Et ke. 
Peri Pp.ibe C6 yr. I, 
六 后 
7 二 4 
人 
KD 
(k= A 2 
N > 
今 Z=(zj)wxp, 则 R=(r; Je ,3 
2) 计算 样品 点 的 协 方差 矩阵 wo 


类 似 上 而 的 六 人 > 一 一 


> 全 
J 
| Ne ..p) 出 发 ， 可 以 计算 刘 样 品 的 协 方差 矩阵 为 


Q= (gj )nxn 一 ZZT 





式 中 
pr py ] 
= Pp,. pb 
人 2 Vp |; le 
> bp j* pup ) 
j=1 Vp.ipr. Pp.iPbr 
p 
= >) zy 
j=l 
5. 进行 数据 的 对 应 变换 
数据 变换 的 公式 为 





be 
”VB Me 








(9=-5) 


C9.=6) 


9 


a 


(9=8) 


由 此 变换 产生 出 矩阵 Z 一 (xi ),xp， 并 且 将 变量 点 的 协 方差 矩阵 表示 为 R= 二 ZT2 的 形 


第 9 章 | 325 


对 应 分 析 


式 ， 将 样品 点 的 协 方差 矩阵 表示 为 0 二 ZZT 的 形式 。R 与 8 两 个 矩阵 存在 明显 的 对 应 关系 ， 
而 且 将 原始 数据 zx; 变换 成 zj; 后 ，zi 对 于 变量 和 样品 具有 对 等 性 。 


您 阅读 案例 9- 1 


汉字 读 写 能 力 与 数学 之 间 的 对 应 关系 


在 研究 读 写 汉字 能 力 和 数学 的 关系 时 ， 人 们 取得 了 232 个 美国 亚 裔 学生 的 数学 成 绩 和 汉字 读 写 能 力 
的 数据 。 

关于 汉字 读 写 能 力 的 变量 有 3 个 水 平 :“ 纯 汉字 ”意味 着 可 以 完全 自由 使 用 纯 汉字 读 写 ，“ 半 汉字 ” 
意味 着 读 写 中 只 有 部 分 汉字 (如 日 文 )， 而 “ 纯 英文 ”意味 着 只 能 够 读 写 英文 而 不 会 汉字 。 数 学 成 绩 有 14 
个 水 平 (A、B、C、D)。 A 

和 
据 以 列 联 表 形式 展示 在 表 9 一 1 中 。 WN 


表 9-1 二 

















总 和 
数学 A 区 B 一 数学 C 数学 D 
纯 汉字 47 al 2 1 81 
汉字 使 用 半 汉 字 22XAN 32 1 10 85 
和 3 ~ | 2 
纯 英 文 如 11 XA 2 20 66 


























和 
英文 的 点 与 最 其 成 绩 (或 者 D。 虽 然 在 顷 皇 标 稍 有 差距 ) 最 接近 ， 而 用 部 分 汉字 国 居 昌国 
的 和 数学 成 绩 也 接近 。 了 

回 


资料 来 源 : http: //www. docin. com/p - 48031343. html. 


应 


3 - 
通过 对 调查 数据 还 作 下 应 分 析 ， 发 现 运用 络 珊 汉 


9.2.2 对 协 方差 矩阵 及 与 O 进行 因子 分 析 人 

1. 线性 代数 中 的 定理 

定理 9.1 设 矩 阵 R=ZTIZ, CO=ZZT, 4; 是 R 的 非 零 特 征 值 ，w; 为 对 应 的 特征 向 量 ， 
则 有 

(1) R 与 8 的 所 有 非 零 特 征 值 相等 。 

(2) @ 的 非 零 特征 值 4; 所 对 应 的 特征 向 量 为 ZTu 。 

由 此 定理 可 知 ， 只 需 对 变量 点 的 协 方 差 矩 阵 进行 R 型 因子 分 析 ， 就 可 以 得 到 样品 点 的 
协 方差 矩阵 Q 型 因子 分 析 的 结果 。 

2. 进行 R 型 与 Q 型 因子 分 析 


1) R 型 因子 分 析 
计算 R=ZTZ 的 特征 值 M: 三 12 三 … 二 ip 。 根 据 其 累计 百分比 
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站 

2 
X100% > 80% 
Dy 

i=1 


提取 前 个 特征 值 ， 即 提取 前 个 公共 因子 。 计 算 其 相应 的 单位 化 特征 向 量 ma ,wz ，…* ui， 
可 以 得 到 前 个 公共 因子 的 因子 载荷 矩阵 ， 即 
mV wv uk VAk 


U= uaVA! uzzVAs U2k VAR 


ap av um Var hy A 
;KN 
2) Q 型 因子 分 析 CA \ 
定理 9.2 对 R=ZTZ 中 的 前 个 特征 值 计算 相应 于 他 = -ZZT 的 单位 特征 向 量 v1 一 Zrm ， 
V2 二 ZTU2 ,四 一 ZI ， 从 而 得 到 前 人 Ce 即 
ViVi vi je 2 \ VIk VAR 
_ | Pe VAT 
AAAN) 


Me \ 四 > 
A 











9.2.3 mi 对 应 分 布 图 3 RS- 


由于 协力 关 知 队 衣 、 @ 具有 相同 的 非 零 等 古 值 ， Woven cent 
供 的 方差 贡献 、 ) 闪 此 ， 在 bp 维 变量 空间 R?’ 中 的 第 1 公 因 子 、 第 2 公 、 第 人 公 因 
子 与 维 样品 空间 R" et pd mb 这 样 就 
可 以 把 变量 和 样品 同时 反映 在 具有 相同 坐标 轴 的 因子 平面 上 。 

对 协 方差 拭 阵 R、@ 进行 因子 分 析 ， 通常 分 别 能 提取 两 个 最 重要 的 公共 因子 Ri 、R: 与 
Qi 、Q: ， 对 应 的 因子 载荷 矩阵 分 别 为 


ulVA uizVAz VVA vizVaz 
M21WVAI uz2VA2 y= ValVA vz VA2 

















= 


UpiAl up2VA2 VAl v2 VA2 


由 于 因子 载荷 避 和 Y 中 的 元 素 ， 其 取 值 范围 是 相同 的 ， 且 元 素数 量 大 

回 浊 5 回 。 小 的 含义 也 是 类 似 的 ， 因 此 可 以 将 它们 看 成 p 个 二 维 点 和 个 二 维 点 绘制 

9 在 一 个 共同 的 坐标 平面 中 ,形成 对 应 分 布 图 . 各 点 的 坐标 即 为 相应 的 因子 

加 载荷 。 通 过 观察 对 应 分 布 图 中 各 数据 点 的 远近 就 能 够 判断 各 类 别 之 间 的 
【期 刊 推荐 】 ”联系 。 
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国名 因由 几 


对 应 分 析 图 的 注意 事项 
对 应 分 析 生 成 的 二 维 图 上 的 各 状态 点 ,实际 上 是 两 个 多 维 空间 上 的 点 的 二 维 投影 在 某 些 特殊 的 情 
况 下 ,在 多 维 空间 中 相隔 较 远 的 点 ， 在 二 维 平面 上 的 投影 却 很 接近 。 此 时 ， 我 们 需要 对 二 维 图 上 的 各 点 
做 更 深 的 了 解 ， 即 哪些 状态 对 公 因 子 的 贡献 较 大 ， 这 与 在 因子 分 析 中 判断 原始 变量 对 公 因 子 贡献 的 方法 





您 阅读 案例 9-2 


对 应 分 析 在 品牌 定位 研究 中 的 应 用 解析 < 


对 应 分 析 是 研究 定性 变量 问 相互 关系 的 有 效 方法 。 ES 的 研究 揭示 变量 不 同 水 平 间 
的 对 应 关系 ， 是 市 场 研究 中 经 常用 到 的 统计 技术 。 

在 品牌 定位 中 经 常 要 采用 对 应 分 析 方法 ， 即 对 于 某 产 念 A 个 形象 评价 用 语 之 间 的 
关系 进行 对 应 分 析 。 例 如 ， 受 某 家 电 企业 的 委托 ， 统计 公司 要 检测 5 个 空调 品牌 的 形象 特征 ， 包 
es 象 空间 包括 热情 的 少年 、 青 春 的 少女 、 成 熟 的 
职业 女性 、 济 朴 的 工人 、 稳 重 的 大 嫂 sw 员 、 有 身份 的 主管 、 博 学 的 教授 等 8 个 形象 指标 。 


该 公司 在 全 国 10 大 城市 进行 了 入 户 研 时 为 3000， 得 到 将 品牌 指标 与 形象 指标 按 交叉 列表 的 方 


式 整理 的 基础 资料 如 表 9 -2 所 示 A] 了 SA 六 上 
a 污 9-2 10 城市 调 Ya 






































品牌 A 543 342 453 609 261 360 243 183 
品牌 B 245 785 630 597 311 233 108 69 
品牌 C 300 200 489 740 365 324 327 228 
品牌 D 401 396 395 693 350 309 263 143 
理想 品牌 147 117 410 726 366 447 329 420 








通过 对 基础 资料 进行 对 应 分 析 ， 得 到 对 应 分 布 图 。 由 于 品牌 与 形象 指标 在 同一 个 坐标 系 下 ， 可 以 借 
助 欧 氏 距离 公式 从 数量 的 角度 度量 品牌 与 形象 指标 间 的 密切 程度 。 从 对 应 分 布 图 中 可 以 非常 直观 地 反映 
出 品牌 A 是 “热情 的 少年 "， 品 牌 也 是 “青春 的 少女 ”， 品牌 C 是 “淳朴 的 工人 、 稳 重 的 大 媳 ”， 品 牌 D 
是 “成 熟 的 职业 女性 ”"， 而 理想 的 品牌 是 “博学 的 教授 ”。 另 一 方面 还 以 欧 氏 距 高 可 以 度量 品牌 间 的 关 
系 ， 如 品牌 C 与 理想 品牌 的 距离 最 短 ， 由 此 可 见 ， 品 牌 C 最 接近 理想 品牌 。 

采用 对 应 分 析 方法 进行 品牌 定位 的 优点 比较 明显 ， 主 要 体现 在 : 

(1) 定性 指标 的 类 别 越 多 ,这 种 方法 的 优势 越 明显 ， 越 容易 刻画 相互 间 的 关系 。 

(2) 提供 了 将 定性 变量 按 定量 方法 处 理 的 途径 ， 从 数量 的 角度 揭示 交叉 列表 行列 变量 间 关 系 的 方法 。 
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(3) 对 应 分 析 图 将 不 同属 性 的 指标 反映 在 同一 坐标 系 下 ,为 品牌 定位 等 问题 的 研究 提供 了 一 个 有 效 
的 方法 。 

采用 对 应 分 析 方 法 进行 品牌 定位 的 局 限 主要 体现 在 : 

(1) 不 能 用 于 假设 检验 ， 并 且 品 牌 间 、 品 牌 与 形象 指标 间 的 距离 是 一 个 相对 关系 ， 其 距离 大 小 无 实 
际 意义 。 如 品牌 A 与 “热情 的 少年 “距离 为 0.5, 品牌 B 与 ”热情 的 少年 “距离 是 1.0， 并 不 表示 品牌 A 
在 这 一 形象 上 是 品牌 B 的 2 倍 。 

(2) 要 求 样本 随机 性 获得 ， 对 拦截 访问 资料 、 重 点 调查 资料 等 非 随机 资料 ， 进 行 对 应 分 析 时 需 根 据 


配额 计算 调整 系数 。 
(3) 当 对 应 点 有 0 出 现 ， 尤其 某 类 样本 数量 占 样 本 总 量 的 比例 较 小 时 ,出 现 分 析 偏 性 的 可 能 性 较 大 ， 
并 且 受 极端 值 的 影响 较 大 。 
AN 
9.3.1 对 应 分 析 的 基本 计算 步 县 从 
fait 其 中 zy 过 0。 对 数据 矩阵 X 做 
应 分 析 的 具体 步骤 如 下 。 


第 一 步 ， ng pt, ),xp， 其 中 ， 
RN 


p 
A i= >> [4 
第 二 步 ， He p， 其中， 和 2 


W 一 xT 
区 5 x 2 = NS pe 
WAP.jPi. ER zy i 4" 
了 


第 三 步 > 

(1) R 型 因子 分 析 : 计算 R=ZTZ 的 特征 根 和 三 ji? 三 … 二 Xp ， 并 计算 相应 的 单位 特征 
向 量 四 ,wz ,… ,up， 按 照 累计 百分比 三 80%， 取 前 & 个 特征 值 入 ,Xs ，…，X (一 般 有 = 二 2)， 
得 到 R 型 因子 载荷 矩阵 ， 即 











UVAI MIIVA2 
v=| 各 A  U22VA2 
up VA up2 Vaz 
(2) Q 型 因子 分 析 : 由 上 述 求 得 的 特征 值 三 Xs 宇 … 三 A， 计算 0 二 ZZT 所 对 应 的 单 
位 特征 向 量 vw 二 ZTui (i 二 1,2,…,k)， 得 到 Q 型 因子 载荷 矩阵 ， 即 
vnVA v2 VA 
i vo VA va Vaz 


VAl V2VA2 
第 四 步 : 做 变量 点 与 样本 点 的 对 应 分 布 图 。 
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在 与 R 型 因子 分 析 相 应 的 因子 平面 上 做 样品 点 图 ， 因 子 轴 记 为 U1 一 Us ，” 国 各 党 回 
回 





在 与 Q 型 因子 分 析 相 应 的 因子 平面 上 做 变量 点 图 ， 因子 轴 记 为 Vi 一 V2。 由 
于 因子 平面 Ui 一 U2 与 因子 平面 Vi 一 Vs 的 坐标 轴 重 合 ， 这 样 就 在 一 个 平面 上 




















同时 显示 了 变量 和 样品 间 的 相互 联系 。 【拓展 知识 】 
OO Oe 
对 应 分 析 方 法 的 优 缺 点 


四 定性 变量 划分 得 类 别 越 多 ,这 种 方法 的 优越 性 越 明显 ; 加 揭示 行 变 量 类 间 与 列 变量 类 间 的 联系 ; 
图 将 类 别 的 联系 直观 地 表现 在 图 形 中 ; @ 不 能 用 于 相关 关系 的 假设 检验 ; 回 维 数 由 研究 者 自 定 ; @@ 受 极 


端 值 的 影响 。 2 
nan 



































SN 
9.3.2 对 应 分 析 的 应 用 人 
严 

【 例 9.1】 对 导入 案例 9 -1 进行 对 应 A 分 省 、 市 、 自 治 区 的 农村 
居民 家 庭 人 均 消费 支出 结构 ， ek 市 ， 选取 8 项 指标 ， 即 食品 支出 
(Xi) 、 衣 着 支出 〈Xz ) 、 居 住 支出 Ne 设备 及 服务 支出 (X41)、 交 通 和 通信 支出 
(X5)、 文 教 娱乐 用 品 及 服务 支出 NS 医疗 保健 支出 :< X7 )、 其 他 商品 及 服务 支出 
(Xs) 。 原 始 数据 资料 如 表 9 ES 利用 2014 年 据 进 和 应 分 析 。 

表 9-3 2014 年 lf0 站 省 市 的 农村 居 ssesumwns (单位 元 ) 
序号 | 省 份 | Xs ”| x xX xX Xs 

北京 4048.0 917.8 4360.77 994.6 1813.0 1097.3 1088.6 215, 1 

2 河北 2421. 2 581.6 1858.5 508.0 1146.5 758.7 788.7 64. 68 

3 山西 2054. 3 539.7 1480. 5 343. 9 706. 5 928. 5 770. 2 168. 2 

4 辽宁 2210.9 531.7 1491.7 331.7 1049. 7 1014. 5 1026. 4 114.2 

§ 上 海 5332.7 860. 4 3615.7 689.5 1830.3 782.7 1330.3 378.3 

6 广东 3968.9 328.3 2238.8 599.7 1068.7 918.2 686.9 233.8 

人 广西 2462. 9 208.6 1550. 8 394. 8 709.7 682.5 553.5 112. 4 

8 海南 3037. 25 247. 9 1328.5 392.8 661.8 760.3 454. 1 146. 4 

9 重庆 3229.0 | 490.5 1294.2 | 569.4 780.4 805.1 677.0 lr 

10 新 疆 2540.2 650.7 1412.8 340.8 1010.4 600.7 717:2 92.4 
































资料 来 源 :《 中 国 统计 年 鉴 (2015)》。 


解 : 第 一 步 ， 对 原始 数据 表 计 算 行 和 、 列 和 、 总 和 ,计算 结果 如 表 9 一 4 所 示 。 
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表 9-4 原始 数据 表 计 算 行 和 、 列 和 、 总 和 计算 结果 

































































省 份 Xi Xs Xs Xs Xs Xe 2 Xs 行 和 

北京 4048.0 917.8 4360.7 994.6 1813.0 1097.3 1088.6 215.1 14535. 1 
河北 | 2421.2 | 581.6 | 1858.5 | 508.0 | 1146.5 | 758.7 | 788.7 64.7 8127.9 
山西 2054. 3 539. 7 1480.5 343.9 706.5 928.5 770.2 168.2 6991. 8 
辽宁 | 2210.9 | 531.7 | 1491.7 | 331.7 | 1049.7 | 1014.5 | 1026.4 | 114.2 | 7770.8 
上 海 | 5332.7 | 860.4 | 3615.7 | 689.5 | 1830.3 | 782.7 | 1330.3 | 378.3 | 14819.9 
广东 | 3968.9 | 328.3 | 2238.8 | 599.7 | 1068.7 | 918.2 | 686.9 | 233.8 | 10043.3 
广西 2462.9 208.6 1550.8 394.8 709.7 682.5 558.5 112.4 6675. 2 
海南 | 3037.3 | 247.9 | 1328.5 | 392.8 | 661.8 | 760.3/ RS 146.4 | 7029.1 
重庆 | 3229.0 | 490.5 | 1294.2 | 569.4 | 780.4 ry 0 | 137.1 7982.7 
新 疆 | 2540.2 50.7 | 1412.8 | 340.8 | 101oy4 认 717.2 92.4 7365. 2 
列 和 | 31305.4 | 5357.2 | 20632.2 | 5165.2 | .10 RN 8348.5 | 8092.9 | 1662.6 | 91340.9 


根据 公式 P; =xz; /zz 


第 二 步 : ee 



































例如 ，P1 一 4048. 0/9 340, 9 443, 全 部 计算 结果 如 表 9 -5 所 示 。 
-1 表 9-5 概率 矩 陈 太 人 

省 份 区 Py Pp. 
北京 “| 0.0443y al00 0.0477 | 0.0iWi9 0.0198 | 0.0120 | 0.0119 | 0.0024 | 0.1591 
河北 | 0. NA 0064 | 0.0203 | 0.0056 | 0.0126 | 0.0083 | 0.0086 | 0.0007 | 0.0890 
山西 | 0.0225 | 0.0059 | 0.0162 | 0.0038 | 0.0077 | 0.0102 | 0.0084 | 0.0018 | 0.0765 
内 蒙 0.0242 | 0.0058 | 0.0163 | 0.0036 | 0.0115 | 0.0111 | 0.0112 | 0.0013 | 0.0851 
辽宁 | 0.0584 | 0.0094 | 0.0396 | 0.0075 | 0.0200 | 0.0086 | 0.0146 | 0.0041 | 0.1622 
广东 | 0.0435 | 0.0036 | 0.0245 | 0.0066 | 0.0117 | 0.0101 | 0.0075 | 0.0026 | 0.1100 
广西 | 0.0270 | 0.0023 | 0.0170 | 0.0043 | 0.0078 | 0.0075 | 0.0061 | 0.0012 | 0.0731 
海南 0.0333 | 0.0027 | 0.0145 | 0.0043 | 0.0072 | 0.0083 | 0.0050 | 0.0016 | 0.0770 
重庆 | 0.0354 | 0.0054 | 0.0142 | 0.0062 | 0.0085 | 0.0088 | 0.0074 | 0.0015 | 0.0874 
四 川 | 0.0278 | 0.0071 | 0.0155 | 0.0037 | 0.0111 | 0.0067 | 0.0079 | 0.0010 | 0.0806 
pes 0.3427 | 0.0587 | 0.2259 | 0.0565 | 0.1180 | 0.0914 | 0.0886 | 0.0182 




















第 三 步 : 计算 数据 变换 矩阵 Z。 


Ps—P 
根据 公式 Zi 一 一 


于 





Pi。 ， 计 算数 据 变换 矩阵 Z。 
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对 应 分 析 
例如 ， 
i pu—p.ipi. 0.0443—0.1591X0. 3427 0.0437 
BL pi 0. 1591X0. 3427 
全 部 计算 结果 如 表 9 一 6 所 示 。 
表 9-6 数据 变换 矩阵 乙 

省 份 EA 之 EA ZZ Zs Ze bd Zs 
北京 一 .0437 | .0073 .0623 一 . 0093 
河北 一 .0229 .0166 -0014 一 . 0225 
山西 一 .0029 .0209 一 . 0084 0107 
内 蒙 一 .0293 | .0113 | 一 .0209 0052 
辽宁 一 .0119 | 一 .0010 | .0157 0201 
广东 .0299 一 .0360 | 一 .0019 0134 
广西 .0120 | 一 .0305 | .0039 一 . 0028 
海南 .0025 | 一 .0268 | 一 .0220\ 一 . 0199 0155 | 一 .0218 | .0053 
重庆 .0312 .0042 Rs NI 一 一 .0034 | 一 .0025 
四 川 .0012 .0350 7) 3 一 .0133 01751%| =. 0081 0095 一 .0129 

第 四 步 ， 计 算 协 方 六 丘 阵 有。 -六 

根据 公式 R= ZZ 计算 协 方 2 果 如 表 9 -7 所 示 ( 协 方差 矩阵 中 数字 对 


称 部 分 略 ) 。 NS 
































表 9-7 协 方差 矩阵 有 R 

.0060 一 .0028 一 .0035 .0006 一 .0005 一 .0000 一 .0020 .0006 
.0051 一 .0003 一 .0007 .0021 .0002 .0027 一 ,0012 
2 = .0071 .0010 一 .0009 一 .0037 一 .0017 一 .0003 
ge eh .0017 .0017 一 . 0002 一 .0015 一 .0007 
一 二 .0174 .0055 0011 一 .0035 
ie .0064 .0022 一 .0001 
i et 0037 一 .0000 
一 一 .0015 


























第 五 步 : 进行 因子 分 析 。 
(1) R 型 因子 分 析 


计算 协 方差 矩阵 玉 的 特征 值 、 方 差 贡 献 率 和 累计 方差 贡献 率 ， 如 表 9- 8 所 示 。 
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表 9-8 协 方差 矩阵 R 的 特征 值 、 方 差 贡 献 率 和 累计 方差 贡献 率 


























序 号 特 征 值 方差 贡献 率 累计 方差 贡献 率 
1 .015 .417 .417 
2 012 | .337 .754 
3 .005 | Jal .885 
4 .002 | .067 .952 
5 .001 | .036 .988 
6 .000 | .010 .998 
7 .000 | .002 1.000 
合计 .035 | 1.000 1.000 











由 于 前 两 个 特征 值 的 累计 方差 贡献 率 已 经 达到 75. 4%， 因 


由 此 确定 公共 因子 个 数 4 一 2。 


对 应 于 R 型 因子 分 析 的 前 两 个 公共 因子 的 因子 载荷 


天 


,7 


站 9 一 9 所 示 。 





表 9 -9 RR 型 因子 载 克 拓 
序 号 村 




















1 SA , 一 .440 
2 K&B .083 
3 NUL.216 | .464 
4 J SN 一 .338 | .616 
5 A .011 P AM 一 ,301 
6 2 .422 一 一 .168 
7 








2 
> 





。 26 
8 “AAA 人 ~ els .068 
1 
(2) MU 


对 应 于 前 面 R 型 因子 分 析 所 得 的 两 个 特征 值 (X41 二 0.015, hs 二 0.012) 及 累计 方差 贡 
献 率 (75.4%)， 同 样 可 以 确定 Q 型 因子 分 析 的 公共 因子 个 数 一 2。 
































对 应 于 Q 型 因子 分 析 的 前 两 个 公共 因子 的 因子 载荷 矩阵 如 表 9 一 10 所 示 。 
表 9-10 Q 型 因子 载荷 矩阵 
序号 vl v2 
1 .418 一 .015 
2 一 .627 .324 
3 —. 259 一 .431 
4 059 一 ,195 
5 一 . 296 一 .021 
6 052 .663 
7 一 - 324 .450 
8 418 一 .015 
9 一 .627 .324 
10 —. 259 








ol 


第 六 步 : 绘制 对 应 分 布 图 。 
在 R 型 因子 平面 上 ， 根 据 因子 载荷 矩阵 U 中 的 数据 做 变量 图 ; 在 Q 型 因子 平面 上 ， 
根据 因子 载荷 矩阵 Y 中 的 数据 做 样品 点 图 ， 如 图 9. 1 所 示 。 



































Row and Column Points 


Symmetrical Normalization 















Es Se 。 消费 结构 种 类 
ud 2 。 省 从 
X7 山西 
人 
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P| 河北 海南 
§ Rl 
a of Ee 广西 @ 入 
上 x4 “ 上 东 Ar 人 
-02[ ° a SS 
-04 上 | 北京 X3 上 海 I 
; 
-0.6 上 NS 
AN 
-06 -04 -02 0 D4 0.6 


图 9.1 komen 
由 图 9. 1 按 样品 和 变量 之 间 的 接 人 | 如 下 : 


北京 一 Xs; 上 海 一 X4s 广东、 广西 海南 Xs; 河北 、 新 疆 、 山 西 和 过 
宁 一 Xe, Xs, Kes 2 全 


CY IY CE SS SE 


4 对 应 分 析 的 调查 数据 


对 应 分 析 的 调查 数据 应 满足 以 下 假设 条 件 : 四 被 调查 者 回答 问题 时 并 不 都 从 同一 角度 〈 或 称 维度 ) 
做 出 判断 ;加 被 调查 者 的 评判 角度 和 看 法 可 以 改变 。 


CT 


人 告 阅读 专栏 9 一 2 





nan 


对 应 分 析 的 假设 


对 应 分 析 是 一 种 旨 在 揭示 定性 资料 中 变量 及 其 类 别 之 间 、 或 者 多 变量 定量 资料 中 变量 和 样品 之 间 相 
互 关 系 的 多 元 统计 分 析 方 法 。 根 据 分 析 资料 的 类 型 不 同 ， 对 应 分 析 分 为 定性 资料 〈 分 类 资料 ) 的 对 应 分 
析 和 定量 资料 的 对 应 分 析 (基于 均 数 的 对 应 分 析 )。 实 际 应 用 中 ,虽然 对 应 分 析 方 法 对 于 原始 数据 类 型 、 
变量 之 间 的 关系 没有 严格 的 限定 ,但 是 对 应 分 析 对 分 析 对 象 、 应 用 场合 还 是 有 一 定 要 求 的 。 要 求 分 析 对 
象 要 有 可 比 性 ,调查 对 象 必 须 有 代表 性 ,变量 的 类 别 或 水 平 ) 应 该 涵盖 所 有 可 能 出 现 的 情况 等 。 下 面 
以 定性 资料 对 应 分 析 为 例 〈 若 所 分 析 的 原始 数据 是 调查 数据 ) 来 阐述 对 应 分 析 的 假设 。 

(1) 被 调查 者 是 从 不 同 的 角度 (或 维度 ) 来 回答 问题 的 。 每 一 个 被 调查 者 是 从 不 同 的 角度 (或 维度 ) 
来 回答 问题 ， 即 每 一 个 被 调查 者 是 用 不 同 的 主观 或 客观 角度 (或 维度 ) 及 指标 来 做 出 判断 并 回答 问题 的 。 
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虽然 主要 的 指标 可 能 会 一 样 ， 但 不 能 完全 一 样 。 例如， 在 调查 人 们 生活 满意 度 时 ， 有 的 从 收入 角度 考虑 ， 
有 的 从 家 庭 关 系 角度 考虑 ， 有 的 从 工作 、 住 房 角度 考虑 ,这 样 所 做 出 判断 的 角度 就 不 一 样 了 。 这 里 ， 收 
入 是 所 有 被 调查 者 都 要 考虑 的 指标 之 一 ， 但 不 是 唯一 的 判断 角度 。 如 果 所 有 被 调查 者 都 以 收入 水 平 作为 
唯一 角度 ， 收 入 这 样 一 个 指标 就 反映 了 生活 满意 度 ， 就 没 必要 进行 对 应 分 析 了 。 

(2) 所 有 被 调查 者 对 于 某 一 判断 角度 〈 或 维度 ) 重要 性 的 评价 是 不 一 样 的 。 例如， 生活 满意 度 调查 
评价 中 ， 有 的 人 认为 收入 水 平 最 重要 ; 但 有 的 人 可 能 认为 收入 多 少 并 不 重要 ， 家 庭 和 睦 才 是 最 重要 的 
车 在 同一 判断 角度 或 维度 ) 上 各 个 调查 者 的 重要 性 都 是 同等 重要 的 ， 没 有 水 平 上 的 差异 ， 这 时 也 没有 
再 进行 复杂 的 对 应 分 析 的 必要 了 。 

(3) 被 调查 者 的 判断 角度 和 标准 随 着 时 间 变 化 是 可 以 改变 的 。 被 调查 者 做 出 评判 时 所 考虑 的 角度 、 
对 每 个 角度 重要 性 的 看 法 都 会 随 着 时 间 推 区 而 改变 ,不 一 定 要 保持 一 致 的 看 法 。 例如， 现在 对 收入 或 生 
活 很 满意 的 人 过 两 年 也 可 能 会 回答 不 满意 。 这 种 变化 上 的 差异 也 是 进行 对 应 分 析 所 必要 的 前 提 。 

(4) 交叉 汇总 表 中 的 单元 格 不 能 为 负数 或 零 。 对 应 分 析 的 基础 是 交叉 证 息 表 ， 表 中 每 一 个 单元 格 都 
代表 着 被 调查 者 选择 某 一 答案 的 频数 ， 也 表示 着 行 或 列 的 对 应 关系 。 < 为 零 的 单元 格 出 现 ， 应 
该 对 变量 的 分 类 进行 合并 ， 去 掉 有 频数 为 零 的 单元 类 别 

上 述 对 调查 数据 的 假定 ， 核 心 是 要 求 调查 变量 及 其 水 平 CN, 对 象 要 有 可 比 性 ， 

这 样 才 有 进行 对 应 分 析 的 必要 ， 也 有 助 于 ste 
加 前 站 回 品 之 间 的 关系 。 定 性 资料 对 应 分 析 如 2 人 
汪 pre rr 
回 就 成 为 检验 对 应 分 析 适 用 性 的 等 要 攻 容 、 
【期 刊 推荐 】 资料 来 源 ， 傅 德 印 ， 玉 饭 . 史册 分 析 统 计 检验 体系 探讨 []]. 统计 与 信息 论坛 ，2010(3)， 
SS > 
X 





3 一 4 





Jr 


b - 2 Nw t 
“用 SPSS 软件 进行 对 应 分 
cng * 
9.4.1 对 应 据 的 预 处 理 六 


用 SPSS 软件 进行 对 应 分 析 之 前 ， 应 首先 组 织 好 数据 。 这 里 只 涉及 两 个 变量 。 如 果 收 集 
到 了 原始 数据 ， 应 将 待 分 析 的 两 组 原始 数据 组 织 成 两 个 SPSS 变量 的 形式 ; 如 果 没 有 原始 数 
据 而 只 有 交叉 分 组 下 的 频数 数据 ， 则 在 对 应 分 析 前 要 对 数据 进行 加 权 处 理 ， 指 定 加 权 变 量 。 

SPSS 中 指定 加 权 变 量 的 过 程 本 质 是 数据 复制 。 例 如 ， 为 了 研究 某 地 区 性 别 (Xi) 与 
工作 状态 (Xs) 之 间 的 对 应 关系 ， 现 收集 到 交叉 分 组 下 的 频数 数据 如 表 9 一 11 所 示 。 


表 9-11 某 地 区 人 口 社会 文化 调查 资料 








工作 状态 
X=0 工作 (X=1 
3 无 业 (X=0) 作 (Xs=1) 
男 (XI 一 0) 43 | 时 
女 (Xi1=1) 52 | 48 








这 里 涉及 2 个 变量 ， 即 性 别 (分 类 值 为 0 和 1) 和 工作 状态 (分 类 值 为 0 和 1)。 如 果 
定 “ 人 数 ”为 加 权 变 量 ， 那么 SPSS 则 将 “男性 ”这 一 行 中 的 “无 业 ” 这 条 数据 复制 43 
个 ,“ 工 作 ” 这 条 数据 复制 57 个 ; 将 “女性 ”这 一 行 中 的 “无 业 ” 这 条 数据 复制 52 个 ， 
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对 应 分 析 
“工作 ”这 条 数据 复制 48 个 。 通 过 这 样 的 加 权 处 理 即 可 得 到 200 个 样本 数据 ， 进 而 可 以 达 
到 将 数据 编辑 窗口 中 的 汇总 数据 还 原 为 原始 数据 的 目的 。 

在 建立 表 9 一 11 的 SPSS 数据 文件 时 ， 可 输入 性 别 (Xi ) 与 工作 状态 (Xs) 2 个 变 
量 , 4 个 样本 ,再 将 人 数 了 指定 为 加 权 变 量 , 予以 加 权 即 可 得 到 200 个 样本 。 建 立 表 9 一 
11 的 SPSS 数据 文件 如 表 9- 12 所 示 。 

表 9-12 加 权 的 数据 文件 
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eh he 、 ， 要 定义 3 个 变量 ， 即 行 变 
量 


量 、 列 变量 和 尺度 变量 。 其 中 ， 行 变量 和 列 变 基 是 分 类 ， 而 尺度 变量 是 对 应 行 、 列 变 
量 的 实际 观测 值 ， 往 往 被 指定 为 加 权 变量 。 例 如 W 痊 例 9. 1 中 ， 研 究 我 国 31 个 省 市 自治 
区 的 农村 居民 家 庭 人 均 消 费 支出 结构 ， 即 和 个 省 份 与 消费 支出 种 类 的 对 应 关系 ， 则 需 
要 定义 的 3 个 变量 是 省 份 (分 类 什 SS 消费 结构 种 类 〈 分 类 值 在 1 一 8) 和 人 均 消 
费 支出 数额 (到 什 是 正 实数 )， 侈 清 人 二 可 以 指 放 为 加 权 变 和 

对 应 分 析 数 据 预 处 理 的 -SPSS 操作 过 程 如 下 ，，》X 

(1) 选择 “Data 一 feht Cases” 选项 ， 弹出 Wikht Cases” 对 话 框 。 

cy 大人 是 对 这 分 人 的 全 部 和 认 有 全 有 2 个 和 人， 单 和 
“DO not weight cas 表示 对 数据 不 加 权 2 不 用 定义 加 权 变 量 ,， 为 默认 项 ; 单 选 按钮 
“Weight caseSywy 表 示 对 数据 进行 加 权 ， 需 要 定义 加 权 变 量 。 

(3) 选中 Weight cases by 单 选 按钮 ， 将 表明 分 类 中 的 频数 的 变量 作为 加 权 变 量 从 左 
侧 列表 框 中 移入 “Frequency Variable” 列 表 框 中 。 权 重 即 为 该 变量 的 数值 。 如 果 定 义 的 
加 权 变 量 有 0 值 ， 定 义 加 权 变量 时 会 发 出 警告 ， 但 不 影响 对 应 分 析 的 正常 分 析 工 作 。 

(4) 单 击 “OK” 按 钮 ， 即 可 完成 对 应 分 析 数 据 的 预 处 理 。 

运行 以 后 ， 数 据 编 辑 器 中 的 原始 数据 并 没有 变化 ， 只 是 在 右 下 角 的 状态 栏 中 显示 
“Weight on” 字 样 。 但 利用 加 权 后 的 数据 进行 统计 分 析 后 所 得 到 的 结果 与 没 加 权 数 据 进行 
统计 分 析 后 得 到 的 结果 完全 不 同 。 

加 权 以 后 的 数据 文件 可 以 进行 保存 ， 方 法 同一 般 的 保存 方法 。 但 保存 以 后 的 数据 文件 
重新 打开 以 后 ， 随 时 可 以 取消 加 权 ， 使 数据 恢复 到 原文 件 状 态 。 方 法 是 在 “Wight Cases” 
对 话 框 中 选中 “DO not weight cases” 单 选 按钮 ， 再 单 击 “OK” 按 钮 。 

在 选择 加 权 变量 时 应 注意 以 下 几 点 : 

(1) 加 权 变量 中 含有 零 、 负 数 或 缺失 值 的 观测 值 应 该 被 排除 在 分 析 之 外 。 

(2) 分 数 权 数值 有 效 。 

(3) 一 旦 定义 了 加 权 变 量 , 那么 在 以 后 的 分 析 中 加 权 变 量 一 直 有 效 ， 直 到 取消 加 权 变 
量 的 定义 为 止 。 
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ICY IY EE 


对 应 分 析 数 据 文件 的 格式 要 求 


对 应 分 析 数 据 的 典型 格式 是 列 联 表 或 交叉 频数 表 ， 常 表示 不 同 背 景 的 消费 者 对 若干 产品 或 产品 属性 
的 选择 频数 。 背 景 变 量 或 属性 变量 可 以 并 列 使 用 或 单独 使 用 。 对 于 需要 进行 对 应 分 析 数 据 预 处 理 的 数据 
文件 ， 要 定义 3 个 变量 ,即行 变量 、 列 变量 和 尺度 变量 (实际 观测 值 )。 行 、 列 变量 在 定义 时 要 将 分 类 变 
量 数 量化 











9.4.2 对 应 分 析 的 SPSS 操作 步 又 


(1) 选择 “Analyze 一 Dimension Reduction CorrespopdigkCnaysis" 选项 ， 弹 出 
“Correspondence Analysis” 对 话 框 。 人 

(2) 将 行 变量 选择 到 “Row” 列 表 框 中 ， a a 按钮 ， 弹 出 “Corre- 
spondence Analysis: Define Row Range” 对 话 参与 分 析 的 行 变量 的 分 类 值 范围 。 
在 “Minimum value:” 文 本 框 中 输入 分 类 最 “Maximum value:” 文 本 框 中 输入 
分 类 最 大 值 ， 并 单 击 “Update” 按 钮 Y 于 是 分 类 值 会 依次 显示 在 “Category Con- 
straints” 框 中 。 SS- 

“Category Constraints” 框 信义 从 类 的 等 约束), 有 有 过 有 3 个 单 选 按钮 。 

@ None 单 选 按钮 : 不 有 对 分 类 秆 重新 分 组 ， 是 统 赋 认 的 方式 。 

加 Categories must cedf 址 单 选 按钮 ， 指 着 将 甫 到 小 类 值 合 并 为 一 类 。 

@ Category at 单 选 按 钮 :， 此 分 类 值 不 参与 分 析 。 

最 后 单 击 “Cohtinue” 按 钮 返回 到 中 SHEspondence Analysis” 对 话 框 。 

(3) 将 列 变 择 到 “Column” 列 表 框 四， 单 击 “Define Range” 按 钮 ， 弹 出 “Cor- 
respondence Analysis: Define Column Range” 对 话 杠 ,定义 参与 分 析 的 列 变量 的 分 类 值 
范围 。 重 复 第 2 步 的 操作 过 程 。 

(4) 单 击 “Model” 按 钮 ， 弹 出 “Correspondence Analysis: Model” 对 话 框 ， 进 行 模 
型 参数 设置 。 

@ Dimensions in solution 参数 框 : 输入 行 、 列 变量 分 类 最 终 提取 的 因子 个 数 。 默认 值 
为 2。 在 对 应 分 析 中 ,最 多 可 以 提取 的 因子 个 数 等 于 两 个 变量 最 小 类 别 数 减 1。 但 是 往往 
前 两 三 个 因子 就 携带 了 绝 大 多 数 信息 ， 因 此 可 以 只 提取 前 两 三 个 因子 即 可 。 

回 Distance Measure 选项 组 : 指定 分 类 点 间距 离 的 测度 方式 ， 包 含 2 个 单 选 按 钮 。 

a Chi square 单 选 按钮 : 卡 方 。 用 加 权 (Profiles) 的 距离 作为 距离 测度 ， 这 里 的 权 
就 是 行 或 列 的 质量 (Mass)。 对 分 类 变量 通常 选 卡 方 (Chi Square)， 这 是 系统 默认 的 
方法 。 

b. Euclidean 单 选 按钮 : 欧 氏 距离 。 用 两 行 或 两 列 之 间 的 差 的 平方 的 平方 根 作为 距离 
测度 。 欧 氏 距 离 更 适合 于 连续 型 变量 。 

加 Standardization Method 选项 组 : 选择 变量 标准 化 方式 ， 这 些 选项 只 在 使 用 欧 氏 距 
离 时 可 用 , 一 般 不 需要 更 改 . 包含 5 个 单 选 按 钮 。 
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a Row and column means are removed 单 选 按钮 : 行 和 列 两 者 被 居中 。 当 选用 卡 方 作 


为 Distance Measure 的 选项 时 ， 系统 只 默认 此 方法 。 
b. Row means are removed 单 选 按钮 : 只 有 行 被 居中 。 
Cc. Column means are removed 单 选 按 钮 : 只 有 列 被 居中 o 














d. Row totals are equalized and means are removed 单 选 按钮 : 在 定 中 心 行 之 前 ， 行 边 




















际 相等 。 

e，Column totals are equalized and means are removed 单 选 按钮 : 在 定 中 心 列 之 前 ， 
列 边际 相等 。 

四 Normalization Method 选项 组 : 选择 常态 化 方法 。 一般 使 用 默认 的 方法 即 可 ， 包 含 
5 个 单 选 按钮 。 

a，Symmetrical 单 选 按 钮 : 使 用 本 方法 可 以 分 析 行 列 变量 各 类 别 之 间 的 联系 ， 而 非 每 
个 变量 各 类 别 之 间 的 差异 。 和 


ee 


c，Row Principal 单 选 按钮 : 使 用 本 方法 可 以 分 





各 类 别 之 间 的 差异 


d，Column Principal 单 选 按钮 : 人 列 变量 各 类 别 之 间 的 差异 。 


e，Custom 单 选 按钮 : 自 定义 。 本 方 


来 制作 特制 的 二 维 图 形 。 





加 单 击 “Continue” 按 钮 返回 到 “ Ke A Analysis” 对 话 框 。 
D 


(5) 单 击 “Statistics” 按 钮 ， 强 刘 人 
定 条 出 叶 上 统计 最， 包含 8 个 复 过 杠 、 2 
@ Correspondence table 选 杠 : 输出 行列 变量 的 交 广 列 联 表 。 


rrespondence Analysis: Statistics” 对 话 框 ， 


和 Overview of ro oinis 复 旨 选 框 :输出 行 变 蕊 分 类 的 因子 载荷 及 方差 贡献 等 。 
图 Overview of Columhn n points 复 选 框 :- 变量 分 类 的 因子 载荷 及 方差 贡献 等 。 


@ Row profiles 复 选 框 : 输出 频数 的 行 -分 比 。 
© SAN 


ifiles 复 选 框 : 输出 频数 的 询 百分比 。 





@ Permutations of the correspondence table 复 选 框 :输出 按 第 一 维度 上 得 分 的 递增 顺 
序 排列 的 行列 对 应 表 ， 可 以 指定 最 大 维度 数 。 

@ Confidence Statistics for 选项 组 : 输出 行 、 列 变量 的 标准 差 及 各 维度 坐标 间 的 相关 
系数 。 在 本 选择 中 包含 2 个 复 选 框 。 

a，Row points 复 选 框 : 输出 包括 标准 差 和 所 有 非 增补 行 分 数 相关 内 容 的 表格 。 


b. 
单 击 


Co 


umn points 复 选 框 : 输出 包括 标准 差 和 所 有 非 增补 列 分 数 相 关内 容 的 表格 。 
“Continue” 按 钮 返回 到 “Correspondence Analysis” 对 话 框 。 


(6) 单 击 “Plots” 按 钮 ， 弹 出 “Correspondence Analysis: Plots” 对 话 杠 ,指定 输出 


哪些 统计 图 


形 。 


SS 








@ Scatterplots 选项 组 : 输出 各 种 散 点 图 ， 包含 3 个 复 选 框 。 


a. 
b. 
名 


d. 


Bip 








ot 复 选 框 : 输出 行列 变量 的 对 应 分 布 图 。 


Row points 复 选 框 : 输出 行 变量 各 类 别 在 第 一 和 第 二 因子 的 载荷 图 。 
Column points 复 选 框 : 输出 列 变量 各 类 别 在 第 一 和 第 二 因子 的 载荷 图 。 

















ID 


abel width for 框 : 指定 散 点 图 中 数据 点 标签 的 长 度 ， 由 于 限制 卷 标 长 度 ， 以 免 


影响 图 形 的 阅读 ， 可 以 把 默认 的 20 改 得 更 小 些 。 


338 | 应 用 统计 学 (第 3 版 ) »》 


@ Line Plots 选项 组 :输出 各 种 线 图 ， 包 含 2 个 复 选 框 。 


a Transformed row categories 复 选 框 : 输出 行 变 量 各 分 类 的 





因子 载荷 线 图 。 


b. Transformed column categories 复 选 框 : 输出 列 变量 各 分 类 的 因子 载荷 线 图 。 



































@ 单 击 “Continue” 按 钮 返回 到 “Correspondence Analysis” 对 话 框 。 

(7) 单 击 “OK” 按 钮 ， 即 可 完成 对 应 分 析 的 操作 过 程 。 

【 例 9.2】 使 用 SPSS 统计 分 析 软 件 对 例 9. 1 进行 对 应 分 析 。 

解 : 在 数据 文件 中 定义 3 个 变量 : 国 丽 
国 上 民国 provinces (省 份 ，1 一 天 津 、 Yew eta Tanslom anobze Grepns Ulites Add 
EE 2 一 河北 、3 一 山西 、4 一 内 ”放量 岛 四 各 纱 汪 靶 陵 的 说 由 置 求 男 
百 蒙古 、5 一 辽宁 、6 一 广东 、 momees 有 
【拓展 视频 】 “一 广西 、8 一 海南 、9 一 重 ES 人 Cn 

庆 、10 一 四 川 ) 、Category 2 XX XY 1 242120 

(消费 结构 种 类 :1 一 Xi 、2 一 Xs、3 一 Xs、 | 3 RN 1 zn 
Xs, 5X, 6—Ko. 1X 国人 
Xs)、Consumption (人 均 消费 支出 数 a 6 1 3968.90 
额 ) 。 建 立 数据 文件 如 下 截取 一 部 分 ): _ SS | 2 

依次 选择 “Analyze 一 Dimension Ca S 9 9 1 3229.00 
airetiGa > Correspondence Analysis ™ ` 选 10 10 1 254020 

， 弹 出 “Correspondence Analyisw 和 - a 3 i 
ee 选择 provinces 变 其 为 行 变 基 ， 13 ni Px!s 2 5s3970 
分 类 值 在 1~10，Category 2 TAY EE 2 170 
其 分 类 值 在 1~8。 指 定 提取 2 个 因子 ， 5 人 








择 系 统 默认 的 Chi Square ee 洒 
Symmetrical 方法 ， 并 输出 相关 统 户 
计量 和 图 形 。 输 出 的 主要 结果 如 下 : 

(1) 输出 对 应 分 析 模 型 的 版 权 信息 ， 如 表 9- 13 所 示 。 


表 9-13 版 权 信息 (Credit) 


图 9.2 SPSS 对 应 分 析 数 据 文件 





Credit 





CORRESPONDENCE 





Version 1.1 





by 





Data Theory Scaling System Group (DTSS) 





Faculty of Social and Behavioral Sciences 





Leiden University, The Netherlands 





对 应 分 析 模块 是 荷兰 Leiden 大 学 DTTS 课题 组 的 研究 成 果 。 
块 ， 所 以 每 次 分 析 结 果 中 均 显示 它 的 版 权 信息 。 
(2) 输出 行 变量 与 列 变量 的 交叉 列 联 表 ， 如 表 9 一 14 所 示 。 





由 于 SPSS 套 




















人 
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表 9-14 对 应 分 析 表 (Correspondence Table) 





消费 结构 种 类 





省 份 Active 
X1 X2 X3 X4 XS X6 X7 XS8 


Margin 





北京 “| 4048. 000 | 917. 800 | 4360. 700 | 994. 600 | 1813. 000 | 1097. 300 | 1088. 600 | 215. 100 | 14535. 100 
河北 | 2421. 200 | 581. 600 | 1858. 500 | 508. 000 | 1146. 500 | 758. 700 | 788. 700 | 64.680 | 8127. 880 
山西 “| 2054. 300 | 539. 700 | 1480. 500 | 343. 900 | 706. 500 | 928. 500 | 770. 200 | 168. 200 | 6991. 800 
辽宁 |2210. 900 | 531. 700 | 1491. 700 | 331. 700 | 1049. 700 | 1014. 500 | 1026. 400 | 114. 200 | 7770. 800 
上 海 “ | 5332. 700 | 860. 400 | 3615. 700 | 689. 500 | 1830. 300 | 782. 700 | 1330. 300 | 378. 300 | 14819. 900 

















广东 “| 3968. 900 | 328. 300 | 2238. 800 | 599. 700 | 1068. 700 | 918. 200 | 686. 900 | 233. 800 | 10043. 300 





广西 2462. 900 | 208. 600 | 1550. 800 | 394. 800 | 709. 700 | 682. 500 537 500 | 112. 400 | 6675. 200 
海南 3037. 250 | 247. 900 | 1328. 500 | 392. 800 | 661. 800 | 760. 300 | 4 Ss 146. 400 | 7029. 050 
重庆 3229. 000 | 490. 500 | 1294. 200 | 569. 400 | 780. 400 | 805: CEZ 000 | 137. 100 | 7982, 700 
新 疆 2540, 200 | 650. 700 | 1412. 800 | 340. 800 | 1010. 400Y 60 717. 200 | 92. 400 | 7365,200 












































7 
Active 

~ |81305. 350| 5357. 200 |20632. 200| 5165. 200 |107 2 348. 500 | 8092. 900 | 1662. 580 | 91340. 930 
Margin r 《NI 











表 9 -14 是 对 应 分 析 表 ， 实际 上 就 是 机 1 量 的 行列 表 。 由 于 对 应 分 析 随 后 的 计算 是 
\ 便 


完全 基于 该 表格 而 来 ， 所 以 首先 于 对 变量 间 的 关联 进行 大 至 的 观察 ， 也 可 用 
于 检查 有 无 数据 录入 错误 。 _ |， 次 

RE ON eed 
(为 14819. 900 元 )， 而 A 675. 200 元 ); 从 列 和 来 看 ，10 个 省 
份 在 食品 (Xi ) 上 的 兴 均 消费 支出 最 多 《为 3305. 350 元 )， 而 在 其 他 商品 及 服务 支出 


CX A (为 1662. 380). 





























(3) 输出 各 频数 在 行 、 列 上 的 百分比 ， 如 表 9 -15 和 表 9 -16 所 示 。 
表 9-15 各 频数 在 行 上 的 百分比 (Row Profiles) 
消费 结构 种 类 
省 份 
EEE 

北京 | .278 | .063 | .300 | .068 | .125 | .075 | .075 | .015 1. 000 
河北 .298 .072 .229 .063 .141 .093 .097 .008 1. 000 
山西 .294 .077 .212 .049 .101 #138 .110 .024 1. 000 
辽宁 | .285 | .068 | .192 | .043 | .135 | .131 | .132 | .015 1.000 
上 海 .360 .058 .244 .047 .124 .053 .090 .026 1. 000 
广东 .395 .033 “223 .060 .106 .091 .068 .023 1.000 
广西 | .369 | .031 | .232 | .059 | .106 | .102 | .083 | .017 1. 000 
海南 | .432 | .035 | .189 | .056 | .094 | .108 | .065 | .021 1. 000 
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表 9-16 各 频数 在 列 上 的 百分比 (Column Profiles) 










































































消费 结构 种 类 

省 份 
XI 1 X3 X4 Xs X6 X7 X8 Mass 
t 京 129 171 211 193 168 131 135 129 159 
河北 077 109 090 .098 106 091 097 039 089 
山西 066 101 072 067 066 111 095 101 077 
辽宁 071 099 072 .064 097 122 127 069 085 
上 海 170 161 175 133 170 094 164 228 162 
广东 127 061 109 116 099 110 085 141 110 
广西 079 039 075 .076 066 082 68 068 073 
海南 .097 .046 .064 .076 .061 .091 训 SN056 .088 | .077 
i 庆 . 103 092 .063 .110 .072 66、 4 .082 .087 
新 疆 .081 1 .068 .066 . 094 Tw .089 .056 | .081 

Active Margin | 1.000 1.000 1.000 1.000 SN 1.000 1.000 1. 000 





表 9-15 和 表 9-16 是 对 表 9-14 的 六。 所 未 了 各 二 人 或 列 上 的 百分比 。 由 


表 9-15 可 以 看 出 ， CN SS (CXs) 和 交通 和 通信 (Xs) 上 的 人 均 
消费 支出 位 居 前 三 位 ， 全 上 人 攻 34. 人 22.6% 和 11.8%。 由 表 9- 16 
可 以 看 出 ， 上 海 、 北 京 和 广 2 消费 支出 f 位 居 前 未 入 分 别 占 人 均 总 消费 支出 的 


16.2%、15.9% 和 11.0%。"* 
(CD 多 二 协和 降格 于 分 析 结果 ， 如 表 4 A 
































>A | 和 
《<— 表 9-17 ,汇总 表 (Summary) 
z 号 di | Proportion of Confidence Singular 
Inertia Value 
Singular 
Dimension Inertia Chi Square | Sig. 
0O Value 回 @ ® Standard | Correlation 
@ Accounted | Cumulative ©® 
for© 0 
2 
1 121 015 417 417 .023 
2 109 012 .337 754 003 
3 068 005 131 885 
4 049 002 067 952 
5 036 001 036 988 
6 019 000 010 998 
尝 008 000 002 1. 000 
Total .035 3228. 935 | . 000* 1.000 1.000 





























a. 63 degrees of freedom 


第 9 章 
对 应 分 析 | 3 

表 9 一 17 中 各 列 的 含义 如 下 : 

第 四 列 是 特征 值 的 编号 ， 提 取 的 特征 值 的 个 数 为 min{ 行 变量 分 类 数 ， 列 变量 分 类 数 } 一 1 

第 加 列 是 奇异 值 ， 它 的 平方 是 惯量 。 奇 异 值 这 个 术语 来 自 于 矩阵 运算 ， 是 对 应 分 析 
计算 步骤 中 进行 奇异 值 分 解 所 得 到 的 东西 ， 对 矩阵 运算 原理 不 熟悉 的 读者 可 不 去 多 考 
虚 它 。 

第 @ 列 是 惯量 ， 也 是 特征 值 ， 表 示 的 是 每 个 维度 对 变量 各 个 类 别 之 间 差 异 的 解释 量 。 
第 一 个 特征 值 最 大 ， 意 味 着 它 解释 各 类 别 差异 的 能 力 最 强 。 特 征 值 的 总 和 为 0. 035。 

第 @ 列 和 第 回 列 是 关于 列 联 表 行列 独立 性 卡 方 检验 的 统计 量 的 值 (为 3228. 935) 和 相 
应 的 概率 p 值 (为 0.000)， 自 由 度 为 (10 一 1) X (8 一 1)= 二 63( 即 表 下 方 “a. 63 degrees of 
freedom” 的 含义 )。 若 取 显著 性 水 平 一 0. 01( 二 户 值 )， 说 明 行 变量 和 列 变量 的 相关 关系 
特别 显著 。 卡 方 检验 及 p 值 可 以 看 成 是 对 应 分 析 适 用 条 件 的 检验 “因为 只 有 当 行列 变 基 之 
间 有 关联 时 ， 才 沉 要 人 用 对 应 分 析 对 这 和 联系 凡人 析 《 条 大 有 人 对 应 分 析 的 
必要 了 。 N 
Oe 
mbt ai me 释 各 类 差异 的 主要 信息 。 

第 @@ 列 和 第 @@ 列 是 两 个 维度 的 标准 差 及 它们 之 间 的 相关 系数 。 

和 
表 9-18 行 变量 各 分 类 的 降 维 情 






































况 表 (Overview Row Points (a)) 
























































Score in 
yy A XC Contribution 
eg x 
, A 
省 份 Mass 2 wR Point to Inertia Of Dimension to 
| CO 1 7 * 光 Fr 7 of Dimension Inertia of Point 
NS Ce 

入 / 1 多 1 2 | Total 
北京 “159 一 .395 一 .440 .007 .205 .282 .421 | .468 | .889 
河北 .089 37 .083 .002 .083 .006 .674 | .037 | .710 
山西 0997 | “=a .464 .003 .029 2 .132 | .548 | .680 
辽宁 .085 | —.338 .616 .005 .080 295 .227 | .675 | .902 
上 海 .162 .011 一 .301 .004 .000 .135 .001 | .419 | .420 
广东 .110 .422 —.168 .003 .161 .028 .804 | .115 | .919 
产 醒 .073 .263 一 -068 .001 .042 .003 .465 | .028 | .494 
海南 .077 .645 .068 .004 .264 .003 .946 | .009 | .956 
重庆 .087 .402 .273 .003 .116 .059 sla | ,而 | ,18 
新 疆 -hel | 一 572 .002 .020 .037 .124 | .188 | .312 

Active Total | 1. 000 .035 1. 000 1.000 
a. Symmetrical normalization 
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表 9-19 列 变量 各 分 类 的 降 维 情况 表 (Overview Column Points (a)) 



























































Score in 
Contribution 
Dimension 
消费 结构 
种 类 Mass Inertia Of Point to Inertia Of Dimension to 
1 2 of Dimension Inertia of Point 
2 | 2 Total 
Xl 343 418 一 .015 008 .494 .001 940 | .001 941 
X2 059 一 .627 324 005 190 056 556 134 689 
X3 226 一 "259 一 .431 007 125 .385 261 648 908 
X4 057 .059 = 19 002 002 和 2 015 142 157 
天 六 
X5 118 一 .296 一 .021 002 085 NA 000 616 | .003 619 
X6 | .052 .663 .006 9002\ \ 1.368 ,005 ,680 .685 
X7 .089 一 .324 .450 . 004 \ 2 i .164 .302 .523 .825 
一 
X8 .018 .416 一 .186 AN .026 .006 .235 | .042 | .277 
Po 
Active Total | 1.000 \ 攻 4 055 1.000 1.000 
a, Symmetrical normalization > RN 














Vv 
表 9-18 中 各 列 的 信义 如 六 ,和 多 
第 四 列 是 行 变量 各 类 别 的 百分比 〈 即 表 9 = 16 刘 的 行 和 )。 
第 @ 列 和 第 四 列 是 秋生 各 分 类 在 第 一 。 往 个 公共 因子 上 的 因子 载 兴 ， 它 们 是 生变 
ti a . 


ona 户 
第 @ 列 和 第 加 列 是 行 变量 各 分 类 对 第 一 、 第 二 个 公共 因子 值 差异 的 影响 程度 。 例如， 
北京 对 第 一 个 公共 因子 值 的 差异 影响 程度 最 大 (为 20. 5%)， 而 重庆 对 第 二 个 公共 因子 值 
的 差异 影响 程度 最 大 (为 28. 2%)。 

第 @ 列 、 第 @ 列 和 第 外 列 是 第 一 、 第 二 公共 因子 对 行 变量 各 分 类 差异 的 解释 程度 。 例 
如 ， 对 北京 类 ， 第 一 个 公共 因子 解释 了 42.1% 的 差异 ,而 第 二 个 公共 因子 解释 了 46. 8% 
的 差异 ， 两 公共 因子 共 解 释 了 88.9% 的 差异 。 新 经 类 的 信息 丢失 最 严重 (信息 损 
失 68. 8%)。 

表 9 一 19 的 含义 与 表 9-18 类 似 。 

(6) 输出 行 变量 和 列 变量 在 第 一 、 第 二 个 公共 因子 上 的 载荷 线 图 ， 如 图 9. 3 一 图 9.6 
所 示 。 

由 图 9. 3 一 图 9. 6 可 以 看 出 ,海南 类 在 第 一 个 公共 因子 上 的 载荷 最 高 (图 9. 3)， 辽 宁 
类 在 第 二 个 公共 因子 上 的 载荷 最 高 (图 9.4); 食品 类 (Xi ) 在 第 一 个 公共 因子 上 的 载荷 
最 高 (图 9. 5) ， 文 教 娱乐 用 品 及 服务 类 (Xs) 在 第 二 个 公共 因子 上 的 载荷 最 高 (图 9. 6) 。 

(7) 输出 行 变量 和 列 变量 在 第 一 、 第 二 个 公共 因子 上 载荷 的 散 点 图 ， 如 图 9.7 和 图 9. 8 
所 示 。 


















































-Dimension 2 Transformed 省 份 Categories 


> 一 
C 


Dimension 1 Transformed 消费 结构 种 类 Categories 
一 


号 
吕 075| 
加 
0 
旋 0.50F 
振 
号 
EE 025 
点 
E 
所 oF 
和 
8 
2 -025[ 
二 


0.4 


0.2 


Dimension 1 Transformed 省 份 Categories 
Symmetrical NormaliZation 
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图 9.4 省 份 在 第 二 个 公共 因子 上 的 载荷 线 图 


Dimension 1 Transformed 消费 结构 种 类 Categories 
Symmetrical NormaliZation 
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图 9.5 消费 支出 种 类 在 第 一 个 公共 因子 上 的 载荷 线 图 
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Dimension 2 Transformed 消费 结构 种 类 Categories 


Symmetrical NormaliZation 
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Dimension 1 
图 9.7 省 份 在 第 一 、 第 二 个 公共 因子 上 载荷 的 散 点 图 


图 9.7 表明 了 省 份 各 类 间 的 差异 性 。 可 以 看 出 ， 在 兼顾 按 样品 和 变量 的 接近 程度 进行 
对 应 分 类 下 ， 若 以 横 轴 和 纵 轴 0 为 中 心 轴 ， 可 粗略 地 将 省 份 分 为 4 类 : 

第 一 类 : 北京 ; 

第 二 类 : 上 海 ; 

第 三 类 : 广东 、 广 西 、 重 庆 、 海 南 ; 

第 四 类 : 河北 、 新 疆 、 山 西 、 辽 宁 。 

图 9.8 表明 了 消费 支出 种 类 各 类 间 的 差异 性 。 可 以 看 出 ， 在 兼顾 按 样品 和 变量 的 接近 
程度 进行 对 应 分 类 下 . 若 以 横 轴 和 纵 轴 0 为 中 心 轴 ， 可 粗略 地 将 消费 支出 种 类 分 为 4 类 : 
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图 9.8 消费 支出 种 类 在 第 一 、 Re 


: Xa3 (居住 ); 
: X1〈 家 庭 设备 及 服 
: XI (食品 )、 Xs1( 其 





第 四 类 ， Xs (衣着 )、 be 全 


(8) 钵 出 行 变量 和 列 变 量 的 对 
应 分 布 图 ， 如 图 9. 全 所 示 。 

由 于 前 两 个 特征 秆 的 方差 贡献 
率 为 41.7% 和 \83 必 % ， 相 差 不 大 。 
因此 ， 在 兼顾 按 样 品 和 变量 的 接近 
程度 进行 对 应 分 类 下 ， 划 分 象限 使 
分 类 更 加 清晰 。 从 图 9.9 可 以 看 
出 ， 若 以 横 轴 和 纵 轴 0 为 中 心 轴 ， 
可 粗略 地 将 省 份 和 消费 支出 种 类 分 
为 4 类 : 

第 一 类 : 北京 一 Xs (居住 ); 

第 二 类 : 上 海 一 X，( 家 庭 设 
备 及 服务 ); 
第 三 类 : 广东 、 广 西 、 重庆、 
海南 一 XI (食品 )、Xs (其 他 商品 
及 服务 ); 

第 四 类 : 河北 、 新 疆 、 山 西 、 
品 及 服务 )、X; 〈 医 疗 保健 ) 。 


























有 2 
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。 (代数 要 东 用 品 及 服务 )、 Xi (医疗 保健 )。 
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Dimension 1 


图 9.9 省 份 和 消费 支出 种 类 的 对 应 分 布 图 


辽宁 一 X (衣着 ) 、Xs (交通 和 通讯 ) 、 


Xs (文教 娱乐 


通过 上 面 的 分 析 ， 我们 发 现 , 类 别 的 划分 具有 明显 的 地 域 性 ， 说明 消费 结构 与 地 域 存 
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在 一 定 的 关系 。 农 民 的 消费 支出 结构 除了 受 地 域 的 限制 之 外 ， 也 从 另外 一 个 侧面 反映 了 农 
民 的 收入 之 间 的 差距 。 
显然 ， 对 应 分 布 图 的 解释 并 不 是 唯一 的 。 读 者 根据 实际 问题 做 作出 合理 的 解释 即 可 。 
【 例 9.3】 研究 妇女 年 龄 与 婚姻 满意 度 的 对 应 分 析 。 将 一 个 由 1090 人 组 成 的 样本 按 5 
个 年 龄 类 别 和 4 个 婚姻 满意 度 类 别 进行 交叉 分 类 ， 所 得 频数 结果 如 表 9- 20 所 示 ， 试 对 这 
组 数据 进行 对 应 分 析 。 





表 9-20 妇女 年 龄 与 婚姻 满意 度 的 调查 结果 
































年 龄 很 不 满意 有 些 不 满意 比较 满意 很 满意 

30 岁 及 以 下 42 82 67 55 

31 一 40 岁 35 62 165 , 118 

41 一 50 岁 13 28 81 

51 一 60 岁 7 18 A 75 

61 岁 及 以 上 3 第 EA 32 54 
回 和 下 回 解 : 在 数据 文件 中 定义 NS : X (妇女 年 龄 ， 1 一 30 岁 以 下 、2 一 
『 31 一 40 岁 ; 3 一 个 一 503 M1 ~60 岁 、5 一 61 岁 以 上 )、Y (婚姻 满意 
回 度 : 1 一 很 不 满意 、 一 有 此 下 消 意 、 3 一 比较 满意 、 cs R (人数 ) 。 
【拓展 视频 】 首先 对 原始 数据 进 行 预 处 理 。 将 人 数 钳 冠 为 加 权 变 量 。 其 次 选择 X 变 
量 为 行 变量 〈 分 类 值 在 1~ 守 7 变量 为 区 变 最 (全 并 人 1~4)。 指 定 提取 2 个 因子 ， 
远 择 系统 默认 的 Chi squife 卡 方 距离 测度 及 St 规 化 方法 ， 并 输出 相关 统计 量 
和 图 形 。 输 出 的 主要 结果 如 下 ; Ky 


(1) 输 ! 与 列 变量 的 交 允 列 诺 如 表 9-21 所 示 。 
NX> 


表 9-21 对 应 表 ( Correspondence Table) 






































满意 度 
很 不 满意 有 些 不 满 比较 满意 很 满意 Active Margin 

30 岁 以 下 42 82 67 55 246 

31 一 40 岁 35 62 165 118 380 

41 一 50 岁 13 28 92 81 214 

51 一 60 岁 7 18 54 75 154 

61 岁 以 上 3 ? 32 54 96 
Active Margin 100 197 410 383 1090 

由 表 9- 21 可 以 看 出 ,在 1090 名 被 调查 者 中 ,31 一 40 岁 的 妇女 人 数 最 多 (为 380 人 )， 


而 61 岁 以 上 的 人 数 最 少 (为 96 人 ); 调查 结果 为 “比较 满意 ”的 妇女 人 数 最 多 (为 410 人 )， 
而 “很 不 满意 ”的 人 数 最 少 (为 100 人 ) 。 
(2) 输出 各 频数 在 行 、 列 上 的 百分比 ， 如 表 9- 22 和 表 9- 23 所 示 。 
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表 9-22 各 频数 在 行 上 的 百分比 (Row Profiles) 
满意 度 
总 很 不 满意 有 些 不 满 比较 满意 很 满意 Active Margin 
30 岁 以 下 lnl 333 272 .224 1. 000 
31 一 40 岁 092 163 434 311 1. 000 
41 一 50 岁 .061 131 430 379 1. 000 
51 一 60 岁 045 117 .351 .487 1.000 
61 岁 以 上 .031 .073 .333 563 1. 000 
Mass .092 .181 .376 .351 



























































很 不 满意 有 些 不 满 SR 很 满意 Mass 

30 岁 以 下 .420 416 M1 .144 .226 

31 一 40 岁 .350 315、X| \".402 .308 349 

41 一 50 岁 . 130 区 个 224 2311 196 

51 一 60 岁 .070 ~、 od 132 .196 .141 

61 岁 以 上 .030 Lr ~\ S036 < .141 088 
Active Margin 十 005 1. 000 x No ~ 1. 000 








由 表 9 -22 和 表 包 - 
妇女 人 数 占 总 
(为 9.2%); 3 


2 


占 总 人 数 的 比例 最 低 (为 8. 8%)。 
(3) 输出 协 方差 矩阵 的 因子 分 析 结果 ， 如 表 9 -24 所 示 。 


数 的 比例 最 高 (为 37. 5 有 
0 岁 的 妇女 人 数 占 总 人 数 的 比例 最 高 (为 34.9%)， 


可 以 看 出 ， 在 1990 澳 守 测 硅 痢 中， 调查 结果 为 “比较 满意 ”的 
“很 不 满意 ”的 人 数 占 总 人 数 的 比例 最 低 
而 61 岁 以 上 的 人 数 

















表 9-24 汇总 表 (Summary) 
Proportion of Confidence Singular 
JInertia Value 
Singular 
Dimension Inertia |Chi Square Sig. 
Be Accounted Standard | Correlation 
Cumulative 
for Deviation 
2 
1 :307 .094 .868 .868 .030 .129 
2 sl .014 .130 .998 .030 
3 .013 .000 .002 1. 000 
Total .108 118. 096 -000* 1. 000 1. 000 
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由 表 9 -24 可 以 看 出 ， 对 列 联 表 行列 独立 性 卡 方 检验 的 结果 表明 行 变量 和 列 变量 具有 
显著 的 相关 关系 。 第 一 个 特征 值 的 方差 贡献 率 达 到 86. 8%， 第 二 个 特征 值 的 方差 贡献 率 达 





到 13.0%。 由 于 





F 前 两 个 特征 值 的 累计 方差 贡献 率 已 经 达到 99.8%， 说 明 用 前 两 个 公共 








子 解释 各 类 别 之 间 的 差异 ,信息 损失 很 少 。 因 此 最 终 提取 2 个 公共 因子 。 
(4) 输出 行 、 列 变量 各 分 类 的 因子 分 析 结果 ， 如 表 9- 25 和 表 9- 26 所 示 。 
表 9-25 行 变量 各 分 类 的 降 维 情况 表 (Overview Row Points (a)) 





































































Contribution 
年 龄 Mass Of Point to Inertia Of Dimension to 
of Dimension Inertia of Point 
1 E A 1 2 | Total 
30 岁 以 下 | .226 | 一 .927 262 061 633 AINA 970 | .030 | 1.000 
31 一 40 岁 。349 016 一 .358 1. 376 005 988 "993 
41 一 50 岁 .196 307 一 .201 .067 848 141 "9098 
51 一 60 岁 .141 520 378 .170 .829 170 .999 
61 岁 以 上 .088 796 588 256 823 174 .998 
Acetive Total | 1.000 1. 000 1. 000 
a Symmetrical normalization Wo 
» Ya 和信 \ 





1 





(QVekfiew Column Points (a)) 
























































Seare im SS 上 
7 > 本 i ,> Contribution 
满意 度 we Rs Of Point to Inertia Of Dimension to 
1 1 2 of Dimension Inertia of Point 
1 这 1 2 | Total 
很 不 满意 .092 = .023 024 256 000 995 | .000 | .995 
有 些 不 满意 | .181 一 :853 .196 041 429 058 979 | .020 | .999 
比较 满意 .376 F199 一 27 .012 038 578 .307 | .693 | 1.000 
很 满意 “351 .491 351 031 .276 364 835 | .165 | 1.000 
Active Total | 1. 000 108 1. 000 1.000 
a. Symmetrical normalization 
表 9-25 显示 了 行 变量 各 分 类 在 第 1 和 第 2 个 公共 因子 上 的 因子 载荷 (Score in Di- 














mension),， 表 9 一 26 显示 了 列 变量 各 分 类 在 第 1 和 第 2 个 公共 因子 上 的 因子 载荷 (Score in 


Dimension) 。 它 们 是 对 应 分 布 图 中 数据 点 的 坐标 。 
(5) 输出 行 、 
由 对 应 分 布 图 9. 10 可 以 看 出 ， 分 布 
第 一 组 : 行 变 量 : 30 岁 以 下 ; 

列 变量 : 有 些 不 满意 、 很 不 满意 。 











图 

















列 变量 各 分 类 的 对 应 分 布 图 ， 如 图 9. 10 所 示 。 
将 行 变量 和 列 变量 分 为 3 组 : 
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Row and Column Points 


Symmetrical Normalization 


















呈 -02 
旧 31 至 40 岁 
中 -0.4 9 比较 清 意 5 满意 度 
-0.6 1 1 1 5 年 龄 
-10 -035 0 0.5 10 


Dimension 1 / KA 
图 9.10 纪 女 年龄 与 红 细 清 意 度 的 对 成 分 布 图 
第 二 组 : 行 变量 ， 31~40 岁 、41~50 岁 ;  / A 
列 变量 ， 比 较 满意 。 X- 
第 三 组 : 行 变量 ， 51~60 岁 、 pe 
列 变量 : 很 满意 。 MG 
对 应 分 析 结果 表明 ， 姑 细 清 塌 计时 皮 的 年 三 有 比较 密切 的 关系 ， 妇女 的 年 龄 越 大 ， 
对 婚姻 的 满意 度 越 高 。 J > %X 
总 之 ， 对 应 分 析 方法 被 普 这 认为 是 探索 性 数据 分 析 的 内 容 ， 它 不 仅 可 以 处 理 定量 数据 ， 
而 且 还 可 以 处 理 分 类 数据 < 前 而 我 们 重点 介绍 了 "2 个 变量 之 间 的 对 应 分 析 ， 实 际 上 对 应 分 析 
还 可 以 处 理 多 个 变 基 志 间 的 对 应 关系 问题 即 多 重 对 应 分 析 )。 例 如 ， 在 对 于 婚姻 满意 度 的 
调查 研究 中 ， NO 识 业 与 婚姻 满意 度 三 者 之 间 的 对 应 关系 。 
国 &gg 回 。 、、 此 外 在 合用 SPSS 统计 分 析 软 件 进行 计算 时 ， 读 者 可 以 根据 研究 问题 
的 侧重 点 ， 有 目的 地 选择 输出 结果 。 对 于 实际 问题 ， 有 时 只 要 能 够 会 用 数据 
鲍 而 出 描述 性 的 点 图 ， 并 能 够 理解 图 中 包含 的 信息 即 可 。 


















































0 有 下 区 【 例 9. 4] 对 导入 案例 9 - 2 进行 对 应 分 析 。 

解 : 调查 的 代码 和 含义 如 表 9- 27 所 示 。 

表 9-27 调查 的 代码 和 含义 表 
代码 含义 代码 含义 代码 含义 
Namel 玉泉 Productl 雪糕 Feell 清爽 
Name2 雪 源 Product2 纯 水 Feel2 甘甜 
Name3 春 溪 Product3 碳酸 饮料 Feel3 欢快 
Name4 期 望 Product4 果汁 饮料 Feel4 纯净 
Name5 波澜 Product5 保健 食品 Feel5 安 闲 
Name6 天 山 绿 Product6 空调 Feel6 个 性 
Name7 中 美 纯 Product7 洗衣 机 Feel7 兴奋 
Name8 雪 浪 花 Product8 毛毯 Feel8 高 档 
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将 一 组 样本 按 8 个 产品 类 别 、8 个 名 称 类 别 和 8 个 感觉 类 别 进行 交叉 分 类 ， 得 到 产品 
名 称 关 于 产品 类 别 和 感觉 的 频数 结果 ， 如 表 9 -28 所 示 。 
表 9-28 产品 、 名 称 和 感觉 的 调查 结果 


















































Namel Name2 Name3 Name4 Names ame6 Name7 Name8 
Productl 50 442 27 21 14 50 30 258 
Product2 508 110 272 51 83 88 645 79 
Product3 55 68 93 36 71 47 37 77 
Product4 109 95 149 41 36 125 44 65 
Product5 34 29 45 302 37 135 42 18 
Product6 11 28 28 31 
Product7 30 12 8 316 
Product8 2 4 9 35 
Feell 368 322 149 170 
Feel2 217 237 119 116 
Feel3 19 25 22 193 
Feel4 142 140 330 68 
Feel5 16 16 21 36 
Feel6 2 14 37 42 
Feel7 4 11 17 81 
Feel8 3 5 】 163 49 





























六 AT 
将 产品 名 称 当 作 行 变 昌 《XI )， 产 品种 类 及 感 沉 当 作 列 变量 (X; ) ， 对 调查 数据 进行 
对 应 分 析 ， 得 到 以 下 主要 答 出 结果 ， 如 表 9 表 9-31 及 图 9.11 所 示 。 


XX P 了 
Ss 









































ummary 
Proportion of Confidence Singular 
Inertia Value 
Singular 
Dimension JInertia |Chi Square Sig. 
Value Accounted Standard | Correlation 
Cumulative 
for Deviation 
2 
1 .562 .315 .382 382 .007 .132 
2 .451 .203 .246 .628 .008 
3 .383 147 .178 .807 
4 272 .074 .090 .897 
5 221 .049 .059 .956 
6 .159 .025 .031 .986 
7 -106 -Oll .014 1.000 
Total .825 10231. 973 + 000% 1.000 1.000 





























a. 105 degrees of freedom 


由 表 9- 29 可 以 看 出 ， 对 列 联 表 行列 独立 性 卡 方 检 验 的 结果 表明 行列 变量 具有 显著 的 


相关 关系 。 所 提取 的 前 两 个 特征 值 的 累计 方差 贡献 率 达到 62. 8%。 
表 9-30 行 变量 各 分 类 的 降 维 情况 表 


Overview Row Points” 
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Score in 
a Contribution 

Xl Mass Inertia | Of Point to Inertia OFf Dimension to 

1 3 of Dimension Inertia of Point 
1 2 有 1 2 Total 
Namel .127 .942 .012 | .744 
Name2 .126 .755 .393 | .696 
Name3 ,124 .140 037 073 
Name4 110 一 ,939 192 641 
Name5 120 =].176 082 719 
Name6 125 一 .390 271 365 
Name7 .137 762 258 643 
Name8 ,132 一 ,325 739 49 

Active Total | 1.000 -| 
































a. Symmetrical normalization” 


/' 表 9-31 列 变量 各 分 类 





降 维 情况 表 


<< 一 
wy Overvi | Points” 















































Score in 
i Contribution 
X2 Mass Inertia Of Point to Inertia Of Dimension to 
1 of Dimension Inertia of Point 
1 2 1 2 Total 
Productl .072 535 1. 468 120 037 .344 097 584 680 
Product2 148 859 一 .535 114 195 .094 540 168 709 
Product3 .039 一 .060 291 004 000 .007 021 392 413 
Product4 .054 .210 一 .068 012 004 .001 108 | .009 117 
Product5 052 一 .814 一 .987 078 061 112 247 292 539 
Product6 -041 一 .795 一 .256 .028 046 .006 521 043 564 
Product7 .072 一 人 LS 962 105 159 148 477 285 762 
Produet8 .033 一 .754 一 1.015 .091 033 075 114 165 279 
Feell 114 635 .288 .039 082 021 661 109 770 
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( 续 ) 
Overview Row Points” 
Score in 
Contribution 
Dimension 

X2 Mass Inertia | Of Point to Inertia Of Dimension to 

| 各 of Dimension Inertia of Point 
1 2 1 2 Total 
Feel2 -081 606 265 .023 053 013 732 | .112 | .843 
Feel3 058 一 5v606 344 034 .352 “091 .443 
Feel4 .082 613 一 .386 032 549 .174 “723 
Feel5 049 一 990 一 .664 035 494 .281 775 
Feel6 .025 一 ,950 一 .072 016 776 004 | .779 
Feel7 039 一 1. 392 504 066 640 067 708 
Feel8 043 一 .353 | 104 476 580 

Active Total 










































由 对 应 分 布 图 9. 11 可 以 看 fs 波澜 
Ns 
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图 9.11 产品 名 称 与 产品 种 类 和 感觉 的 对 应 分 布 图 
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对 应 分 析 

系 ， 引 起 的 感觉 是 “兴奋 ”(Feel7)。 因 此 ,“ 波 澜 ” 不 是 合适 的 纯净 水 品牌 名 称 。 中 美 纯 
水 公司 的 产品 是 “ 纯 水 ”(Product2)。 如 果 想 要 使 该 名 称 给 人 们 一 种 “纯净 ”(Feel4) 的 
感觉 那么 “中 美 纯 ” (Name7) 将 是 最 好 的 商品 名 称 ; 如 果 想 要 使 该 名 称 给 人 们 一 种 


“清爽 ”(Feell) 的 感觉 那么 “玉泉 ”(Namel) 将 是 最 好 的 商品 名 称 。 回 坟 虑 加 
需要 说 明 的 是 ， 尽 管 提取 两 个 公共 因子 损失 一 定 的 信息 (损失 38. 2%)， 车 
但 是 对 应 分 析 的 结果 对 于 新 产品 名 称 的 定位 仍然 具有 一 定 的 参考 价值 。 百 
【期 刊 推荐 】 
LA 实例 分 析 上 
对 应 分 析 数 据 文件 的 格式 要 求 


对 应 分 析 数 据 的 典型 格式 是 列 联 表 或 交叉 频数 表 ， 常 表示 未 则 鹤 景 的 消费 者 对 若干 关 
品 或 产品 属性 的 选择 频数 。 背景 变量 或 属性 变量 可 以 并 列 被 削 吕 单独 使 用 。 对 于 需要 进行 
对 应 分 析 数 据 预 处 理 的 数据 文件 ， 要 定义 3 个 变量 ， 即 独 变 量 、 列 变量 和 尺度 变量 (实际 
观测 值 )。 行 、 列 变量 在 定义 时 要 将 分 类 i 

一 、 学 习 目 标 AXN 

通过 本 案例 的 学 习 ， 能 够 用 SPSS 软件 实现 对 应 分 析 ， 领 会 对 应 分 析 技 术 的 精 丹 ， 并 
对 栓 出 结果 结合 实际 进行 科学 的 解读 税 分 祈 

二 、 案 例 分 析 we 2 

对 应 分 析 是 一 种 多 元 统 评分 析 技 术 ， 主 要 分 析 定 性 考据 (Category Data) 方法 ， 也 是 
强 有 力 的 数据 图 示 化 技术 人 当然 也 是 强 有 力 的 市 场 研究 分 析 技术 。 对 应 分 析 的 主要 应 用 领 
域 有 概念 发 展 Coneept Development) 、 新 产品 (New Product Development)、 市 场 细 
分 (Market Segmenfation)、 竞 争 分 析 Competitive Analysis)、 广 告 研 究 (Advertise- 
ment Researcli NE 主要 回答 以 下 问题 :六 

谁 是 我 的 用 户 ? 还 有 谁 是 我 的 用 户 ? 谁 是 我 竞争 对 手 的 用 户 ? 相对 于 我 的 竞争 对 手 的 
产品 ， 我 的 产品 的 定位 如 何 ? 与 竞争 对 手 有 何 差异 ? 我 还 应 该 开发 哪些 新 产品 ?对 于 我 的 
新 产品 ,我 应 该 将 目标 指向 哪些 消费 者 ? 等 等 。 

在 市 场 细 分 研究 实践 中 ， 往 往 遇 到 的 问题 就 是 哪些 背景 〈 受 教育 程度 、 收 入 、 职 业 
等 ) 的 消费 者 在 使 用 我 们 的 产品 ? 他 们 在 消费 行为 上 有 什么 差异 ? 我 们 的 产品 品牌 形象 与 
竞争 对 手相 比 在 消费 者 心目 中 究竟 是 怎样 的 ? 等 等 。 以 往 在 分 析 时 只 是 通过 列 联 表 来 表现 
他 们 之 间 的 关系 ,通过 X2 检 验 来 分 析 他 们 之 间 的 关系 。 如 果 仅仅 是 两 个 变量 ， 且 每 个 变量 
类 别 较 少 的 情况 下 ， 就 很 难 直 观 地 揭示 出 变量 之 间 的 内 在 联系 。 对 应 分 析 方 法 的 运用 有 效 
地 解决 了 这 些 问题 。 

对 应 分 析 技 术 在 市 场 细 分 、 产 品 定位 、 品 牌 形 象 及 满意 度 研究 等 领域 正在 越 来 越 广泛 
的 运用 。 下 面 结合 啤酒 市 场 细 分 案例 简 述 对 应 分 析 的 运用 及 注意 的 几 个 问题 。 在 分 析 不 同 
消费 者 对 不 同 啤酒 品牌 的 偏好 时 可 以 把 啤酒 的 品牌 与 消费 者 的 性 别 、 年 龄 、 职 业 和 收入 
等 进行 对 应 分 析 。 

需要 解决 的 问题 是 : 根据 消费 者 的 背景 资料 推断 他 们 对 啤酒 品牌 的 偏好 。 
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1. 选择 要 进行 分 析 的 相关 变量 



















































































在 分 析 不 同 消费 者 对 不 同 啤酒 品牌 的 偏好 时 ， 可 以 把 啤酒 品牌 与 消费 者 的 性 别 、 年 
龄 、 职 业 和 收入 等 进行 交叉 汇总 ， 得 出 下 列 频 次 交叉 表 ， 如 表 9 一 32 所 示 。 
表 9-32 不 同 消费 者 对 不 同 啤酒 品牌 的 偏好 初始 表 
品 牌 
属 性 华 丹 干 啤 | 华 丹 11 度 | 雪花 | 金 士 百 干 啤 | 金 士 百 | 哈 啤 | 其 他 
20 一 29 岁 75 30 9 5 光 1 
30 一 39 岁 76 42 1 9 多 2 和 
40 一 50 岁 59 46 3 9 | Sh 2: 
高 中 /技术 学 校 /中 专 /职高 119 68 11 14 Ke 一 1 
大 专 54 24 8 /CK 4 1 1 
大 学 本 科 34 25 你 二 | 2 2 1 
研究 生 及 以 上 3 1 a 下 
专业 技术 人 员 /教师 /医生 16 下 | XB 2 2 一 一 
机 关 事业 单位 管理 人 员 65 | 人 下 |”: 1 1 1 
机 关 事业 单位 一 般 职 员 2 XN | : 3 4 一 二 
企业 管理 人 员 o> 1s 5 、 5 1 
企业 普通 员工 Y8 30 1 76 1 1 1 
个 体 / 私 营业 主 ， 1— 32 20 ds 有 一 Sy 1 
学 生 < 15 8 | 3 一 2 一 
离 届 人 SS > 3 | 二 1 EE 三 一 
其 他 7 5 一 1 2 = = 
2. 对 应 分 析 


1) 整理 交叉 列 联 表 


对 交叉 表 进 行 整理 ， 调 整 “ 野 点 子 "。 汇 总 表 中 的 每 一 个 单元 格 不 能 为 负数 或 零 ， 如 
果 有 则 必须 进行 必要 的 类 别 调整 。 例 如 ， 本 例 中 离 退 休 与 雪花 、 华 丹 11 度 的 交叉 分 析 ， 
其 结果 为 零 或 相 比 之 下 极 小 的 频次 都 会 产生 偏差 ， 不 具有 代表 性 ， 因 此 必须 采取 合并 类 项 
的 方式 加 以 调整 。 调 整 后 的 交 又 表 如 表 9 一 33 所 示 。 


表 9-33 调整 后 的 不 同 消费 者 对 不 同 啤酒 品牌 的 偏好 表 














局 性 二 华 丹 干 啤 | 华 丹 11 度 | 雪花 | 金 士 百 干 啤 | 金 士 百 其 他 
20 一 29 岁 75 30 9 5 va 2 
30 一 39 岁 76 42 12 9 7 2 
40 一 50 岁 59 46 5 9 a 2 







































































对 应 分 析 
( 续 ) 
品 有 牌 

属 性 华 丹 干 啤 | 华 丹 11 度 | 雪花 | 金 士 百 干 啤 | 金 士 百 其 他 
高 中 /技术 学 校 / 中 专 / 职 高 119 68 11 14 杂 1 
大 专 54 24 8 8 4 1 

大 学 本 科 及 以 上 37 26 7 1 2 
专业 技术 人 员 / 教 师 / 医 生 46 25 6 2 2 1 
机 关 事业 单位 管理 人 员 15 9 2 1 1 1 
机 关 事 业 单 位 一 般 职 员 12 s 2 上 上 4 1 
企业 管理 人 员 25 15 § NA 5 1 
企业 普通 员工 5 30 NE 6 1 2 

个 体 /私营 业主 32 20 NS 5 1 1 

其 他 25 外 人 三 2 4 1 





2) 对 给 出 结果 进行 市 场 细 分 分 

在 以 往 的 分 析 研 究 申 ,我 人 只 能 知道 某 一 年 龄 EN 不 同学 历 的 被 访 者 对 啤酒 
品牌 信 好 的 频次 ， 依 此 进行 对比 ， 而 在 对 应 分 析 中 结 念 束 9 -34 一 表 9 -36 和 图 9.12 就 可 
以 更 深入 、 更 形 yy SS 




















六 表 9 34 一 汇总 表 
7 
Af Proportion of Inertia 
Dimension | Singular Value Inertia Chi Square 
Accounted for Cumulative 
1 .132 .017 .461 .461 
2 .098 .010 .253 .713 
3 .078 .006 .161 .874 
4 .053 :003 .074 .949 
5 .044 .002 .051 1. 000 
Total .038 45. 399 “919" 1.000 1. 000 























a. 60 degrees of freedom 





由 表 9- 34 可 以 看 出 ， 本 案例 中 到 第 四 个 维度 才 可 解释 全 部 变量 的 94.9% 以 上 ， 因 此 
前 两 个 维度 代表 的 信息 量 有 较 多 的 损失 。 但 考虑 到 金 士 百 、 金 士 百 干 啤 和 雪花 的 比例 并 不 
高 ， 因 此 从 总 体 上 看 其 绝对 作用 还 是 很 小 的 。 
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表 9-35 和 表 9-36 是 行 、 列 变量 的 降 维 情况 ,也 就 是 行 、 列 变量 分 布 在 第 一 和 第 二 
个 公共 因子 上 的 因子 载荷 ， 它 们 就 是 对 应 分 析 图 中 的 坐标 。 
表 9-35 行 变量 各 分 类 降 维 情况 表 





Overview Row Points* 














Score in 
Contribution 
Dimension 
消费 者 背景 NES Inertia |or point to Inertial 。 Or Dimension to 
1 2 of Dimension Inertia of Point 
= 

1 1 2 Total 
| 人 ‘otal 
20 一 29 岁 .107 .202 .399 .003 | 174 .187 | .538 | .725 








30 一 39 岁 .123 | .112 | .050 | .oo Re .003 | .308 | .046 | .354 








40 一 50 岁 .103 | 一 .374 | 一 .469 SA 
A 
/技术 学 校 / RR 
CN .187 | .ol12 SG- .002 | .000 | .073 | .oo2 | .291 | .292 
中 专 /职高 SAN 
re OE 
大 专 .082 | 1 ~—.049| .002 "A .002 | .089 | .009 | .099 








5 7 
大 学 本 科 及 以 上 并 一 .289 | .543 oa .188 | .151 | .396 | .547 























专业 技术 人 员 / os 六 这 
J13068 | 一 .301 | .423%K™:002 .047 | .125 | .376 | .551 | .928 
any 
机 关 事业 单 位 
.024 | 一 .143 | .310 .001 .004 | .024 | .072 | .250 | .322 
管理 人 员 
机 关 事业 单位 
.025 | 1.256 | 一 .554 | .007 .298 | .078 | .761 | .110 | .870 
一 般 职 员 
企业 管理 人 员 .046 | .714 | 一 .098 | .004 .177 | .005 | .856 | .012 | .868 
企业 普通 员工 .082 | 一 .436 | 一 .034 | .003 .118 | .001 | .765 | .003 | .769 
个 体 /私营 业主 “5 和 | 一 :55 | 一 .3 .002 .050 | .069 | .507 | .381 | .888 
其 他 .038 .590 .255 .002 .101 .026 | .746 | .103 | .849 
Active Total 1. 000 .038 1.000 | 1.000 
































a. Symmetrical normalization 
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表 9-36 列 变量 各 分 类 降 维 情况 表 
Overview Cloumn Points” 
Score in 
re Contribution 
啤酒 品牌 | Mass Inertia | Of Point to Inertia Of Dimension to 
和 p of Dimension Inertia of Point 
1 2 1 2 | Total 
华 丹 干 啤 | .525 | 一 .052 的 . 003 .011 .095 .062 | .303 | .365 
华 丹 11 度 | .295 一 502 一 . 169 .006 .142 447 149 596 
雪花 .065 .287 .548 .004 .041 16 437 599 
金 士 百 干 啤 | .057 .245 一 1.003 .007 .026 064 788 852 
金 士 百 .043 1. 540 一 .088 014 |, Ws) | 003 .958 | .002 | .961 
其 他 .015 .140 .402 .004 | Voby ,025 .011 | .065 | .076 
Active Total | 1. 000 和 \ 1.000 1. 000 


























~ 。 啤酒 品牌 
。 消 费 者 背景 
1 中 
大 学 本 科 及 以 上 雪花 啤酒 
四 ° 
05| 专业 技术 人 员 / 教 师 医 。 e020~20 
8 机 关 事业 单位 管理 人 员 30~39y ° 
EE 华 丹 干 啤 . 百 唱 洒 
A or 企业 人 员 金 士 百 啤酒 
个 业 靖 通 员 和 有 1 此 
,ww 2 。 高 中 /技术 学 校 中 专 / 
2 机 关 事 业 单位 一 般 趴 员 
40 一 50 岁 用 
金 士 百 二 只 
_10 o 
i -03 加 号 10 点 20 
Dimension 1 


9.12 对 应 分 布 图 
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用 坐标 图 示 表 示 出 来 。 实 心 点 分 布 表示 属性 类 别 间 的 差异 ， 空 心 点 分 布 表示 品牌 类 别 之 间 
的 差异 ; 同时 也 更 加 直观 地 把 属性 和 品牌 这 两 个 变量 之 间 的 类 别 联系 形象 地 表现 出 来 。 在 
对 应 分 析 中 ,特征 相似 的 类 别 会 聚集 到 一 起 ,很 大 的 类 别 会 相距 较 远 。 

从 图 9.12 可 以 看 出 当地 普通 啤酒 品牌 与 消费 者 背景 情况 之 间 、 品 牌 与 品牌 之 间 、 不 
同 的 消费 者 之 间 的 关系 。 

年 龄 在 30 一 39 岁 、 学 历 为 高 中 或 中 专 以 上 的 企业 普通 员工 ， 机 关 事 业 单 位 的 普通 干 
部 距离 华 丹 干 啤 和 华 丹 11 度 较 近 ， 换 和 句 话说 ， 这 些 人 比较 喜欢 华 丹 ;人 金 士 百 与 金 士 百 干 
啤 距 离 较 远 ， 这 表明 喜欢 金 士 百 的 消费 者 与 喜欢 金 士 百 干 啤 的 人 差别 较 大 ; 华 丹 干 啤 、 华 
丹 11 与 金 士 百 和 爹 士 百 干 啤 距离 较 远 ， 说 明 人 金 士 百 品牌 与 华 丹 品牌 有 较 大 差异 ;从 职业 
来 看 ， 事 业 单位 职工 与 其 他 职业 的 消费 者 之 间 有 较 大 差异 。 相 比较 之 下 ，40 一 45 岁 的 被 
访 者 更 偏好 金 士 百 干 啤 ; 20~29 岁 的 年 轻 人 更 喜欢 雪花 。 x 

应 该 说 ， 在 被 访 者 背景 资料 的 纵向 对 比 中 所 占 比 例 不 光 < 涡 乱 痢 向 对 比 中 所 占 比例 
国 ## 虹 加 。 较 大 ; 同样 对 于 品牌 之 间 的 纵向 对 比 与 横向 对 此 所 占 比 例 基 本 一 致 ， 本案 
2 例 中 的 大 部 分 信息 主要 体现 在 第 一 人 度 兴 人 由 于 对 应 分 析 综 全 合 考虑 了 行 比 
[Dt 例 与 列 比例 的 差异 ,因此 在 同一 图 甫 中 表现 了 品牌 与 消费 者 此 这 间 的 内 在 
【期刊 推荐 】 联系。 XN 
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对 应 分 析 方 法 是 一 逢 多 元 相依 变量 统计 欠 析 小 不 、 它 通 过 分 析 由 定性 变量 构成 
的 交互 江 总 表 来 接 认 变 蕴 之 间 的 联系 从 咬定 议 分 析 定 性 变量 数据 ， 也 可 以 分 析 非 
统 性 关系 。 对 应 分 及 方法 对 于 数据 类 漠 丙 量 之 间 的 关系 没有 严格 的 限定 。 但 是 ， 
调查 对 象 必 须 有 代表 性 ， 研 究 对 象 要 有 可 比 性 ， 变 量 的 类 别 应 该 涵盖 所 有 可 能 出 现 


的 情况 。 
关键 术语 
Correspondence analysis ”对 应 分 析 Contingency table 列 联 表 
Principal components 主 成 分 Correspondence plot 对 应 图 
JInertias 惯量 Eigenvalues 特征 值 
Singular values 奇异 值 Chi— square 直方 





Xn 
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习 题 9 
一 、 选 择 题 
1. 对 应 分 析 方法 与 ( ”) 有 关 。 
A. 聚 类 分 析 B. 因子 分 析 C. 回归 分 析 D. 方差 分 析 
2. 简单 对 应 分 析 用 于 展示 ( 。“”) 变 量 之 间 的 关联 关系 。 
A. 1 个 2 让 全 了 不 D. 多 个 
3. 对 应 分 析 以 〔 ”) 为 分 析 基 础 。 
A. 列 联 表 B. 统计 表 C. 协 方差 阵 D. 相关 系数 阵 
4. 对 应 分 析 把 ( ””) 反 映 到 相同 坐标 轴 的 一 张 图 上 。 
A. 变量 B. 样本 C. 变量 和 样本 k 和 Cn 公共 因子 
5. 对 应 分 析 大 都 是 基于 ( ， ) 因 子 进行 的 。 CQ 
A. 前 2 个 B. 前 3 个 & St D. 全 部 
二 、 判 断 题 
1， 对 有 terete ¢ 有 
2. 对 应 村 相 江宁 的 第 当 开 和 必 四 者 自行 决定 6 
3. 对 应 分 析 不 适宜 小 样本 数据 使 有 人 
4. 极端 mene 任何 影响 ， ¢ 
三 、 简 答题 > xz 
1 闸 述 对 应 分 析 的 疡 生源 而 及 背景， Nw 
2. 对 应 分 析 与 聚 类 分 析 有 什么 不 同 ? 
3， 对 应 分 析 与 因 于 分析 有 什 么 不 同 中 全 Sg 
4. 在 对 应 分 析 沾 ， 为 什么 要 进行 数据 演 狗 ? 
5 对 应 分 柿 要 求 的 数据 文件 是 什么 形式 ?进行 对 应 分 析 前 为 什么 要 进行 数据 的 预 处 理 ? 
6. 根据 头发 与 眼睛 颜色 测试 的 SPSS 对 应 分 析 输出 结果 ， 回答 有 关 问 题 。 
研究 者 收集 了 苏格兰 北部 Caithness 郡 5387 名 小 学 生 眼 睛 与 头发 颜色 的 数据 ， 如 表 9- 37 


所 示 。 其 中 眼睛 有 深 、 棕 、 蓝 、 


浅 4 种 颜色 ， 头 发 又 金 、 红 、 棕 、 深 、 黑 5 种 颜色 。 研 究 者 























希望 知道 头发 和 眼睛 的 颜色 间 存 在 何 种 关联 ， 即 某 种 头发 颜色 的 人 其 眼睛 更 倾向 于 何 种 颜色 。 
表 9-37 头发 颜色 与 眼睛 颜色 的 交叉 表 
眼睛 颜色 二 金色 红色 棕色 深 色 黑色 合计 
深 色 98 148 403 681 85 1315 
棕色 343 84 909 412 26 1774 
蓝 色 326 38 241 110 3 718 
浅 色 688 116 584 188 4 1580 
合计 1455 286 2137 1391 118 5387 
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采用 SPSS 对 应 分 析 功 能 ， 得 到 表 9 -38 所 示 的 输出 结果 。 
表 9-38 汇总 表 
Summary 
Proportion of Confidence Singular 
Inertia Value 
Singular Chi 
Dimension Inertia Sig. 
Value Square Accounted Standard | Correlation 
Cumulative 
for Deviation 
2 

1 146 -199 .866 + 866 .012 .274 

2 .173 .030 131 | .013 

3 .029 .001 004< A 000 
Total 230 1240. 039 .000" 1. 000 





























a，12 degrees of {reedom 

















20 。 头 发 关 色 
。 眼睛 颜色 
1.5F 
1 中 去 
VD 
)oy 
各 
a 
| 六 名 条 色 
深 色 深 色 
金色 蓝 色 名 
全 6 。 
-0.5 黑色 
2 
-1.0 上 上 了 1 1 
一 1.0 -0.5 0 0.5 1.0 1.5 2.0 
Dimension 1 


图 9. 13 头发 与 眼睛 颜色 的 对 应 分 布 图 


(1) 对 输出 的 Summary 表 进 行 解释 。 

(2) 对 对 应 分 布 图 进行 解释 。 

(3) 通过 头发 与 眼睛 颜色 测试 的 对 应 分 析 ， 研 究 者 最 终 能 够 得 出 什么 结论 ? 

. 上 机 实验 题 

1. 为 了 研究 家 庭 年 收入 与 户型 选择 方面 的 关系 ， 力 图 发 现 家 庭 年 收入 对 户型 选择 的 
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影响 及 情绪 ， 现 收集 到 购买 商品 房 的 客户 背景 资料 和 房屋 购买 情况 的 数据 ( 表 9- 39)。 根 
据 这 些 数 据 分 析 不 同 客户 对 户型 购买 的 偏好 。 


表 9-39 家 庭 年 收入 与 购买 户型 的 调查 数据 资料 


| 361 














收入 | ”5000 元 5000 一 10000 一 25000 一 50000 一 70000 元 
户型 以 下 10000 元 25000 元 50000 元 70000 元 以 上 
= 和 2 4 5 0 0 0 
两 室 一 厅 全 70 75 13 2 0 
两 室 两 厅 2 26 52 11 3 0 
三 室 一 厅 7 49 102 20 , 4 3 














两 室 两 厅 单 卫 1 六] 0 0 
两 室 两 厅 双 卫 0 3 16Y A 3 


两 室 三 厅 单 卫 0 0 KS py i 0 0 0 








人 





























= 
马 
ww 


X 
奖品 牌 。 随 机 调查 了 3 种 职业 的 120 名 男 
性 青年 对 4 种 服装 品牌 的 尖 天 情况 。 调 查 结 淋 刀 表 9 40 所 示 。 试 对 这 组 数据 进行 对 应 
分 析 ， ,< * 民 


2. 为 了 考察 不 同 职 的 光 革 男性 所 将 交 的 服 半 和 入 


表 9-40 120 名 男性 青年 对 四 种 服装 品牌 的 选择 情况 











C | 15 | 5 5 








D | 15 | 5 0 





3. 城镇 居民 家 庭 生 活 消费 支出 是 指 常住 居民 家 庭 用 于 日 常生 活 的 全 部 开支 ， 是 用 来 
反映 和 研究 城镇 居民 家 庭 实 际 生活 消费 水 平 高 低 的 重要 指标 。 主 要 包括 食品 支出 (X1)、 
衣着 支出 (Xs)、 居 住 支出 (Xs)、 家 庭 设备 及 服务 支出 (X4)、 医 疗 保健 支出 (Xs)、 交 
通 和 通讯 支出 (Xs)、 教 育 文 化 娱乐 服务 支出 (Xr)、 杂 项 商品 和 服务 支出 (Xs) 8 项 指 
标 。 表 9-41 列 出 了 2014 年 我 国 31 个 省 市 自治 区 的 城镇 居民 家 庭 平均 每 人 全 年 消费 性 支 
出 的 统计 资料 。 试 用 对 应 分 析 方 法 研究 中 国 10 个 省 市 自治 区 城镇 居民 家 庭 消费 的 分 布 
规律 。 
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表 9-41 2014 年 10 个 省 市 自治 区 城镇 居民 家 庭 平 均 每 人 全 年 消费 性 支出 原始 数据 



























































(单位 : 元 ) 

序号 省 份 xX Xz: Xs Xs Xs Xe xX Xs 
1 北京 8007.8 | 2587.4 | 10308.4 | 2206.6 | 3857.2 | 3610.9 | 2044.4 | 1059.2 
2 河北 | 4240.8 | 1424.4 | 3735.8 | 1081.6 | 2448.4 | 1591.9 | 1304.5 | 376.5 
山西 | 3804.0 | 1616.0 | 2898.8 | 887.9 | 1709.8 | 2026.5 | 1240.9 | 452.9 
4 辽宁 | 5816.9 | 1987.2 | 4428.2 | 1234.8 | 2434.3 275.9 | 1630.8 | 711.4 
5 上 海 | 9438.6 | 1700.4 | 11621.7 | 1629.4 | 3801.5 | 3605.5 | 2327.6 | 1058.3 
6 广东 | 7850.2 | 1344.7 | 5291.5 | 1365.1 | 3625.4 | 2468.4 | 988.3 | 678.1 
P 广西 | 5293.7 | 794.6 | 3389.7 | 904.5 1845.9 | 1688.9 | 845.9 | 282.1 
8 海南 | 6655.3 | 829.9 | 3697.8 | 957.7 2 二 960.3 | 343.8 
9 重庆 | 6308.4 | 1878.1 | 3520.8 | 1292.6 | 2009<7< 13.6 | 1187.7 | 368.6 
10 新 疆 | 5529.7 | 1912.4 | 3262.8 | 1087.6 ST 1741.0 | 1310.9 | 433.5 





资料 来 源 :《 中 国 统计 年 鉴 (2015)》 


4. 全 国 各 地 
办 学 校 办 学 经 费 
学 杂费 (Xs )、 











< 


产 
NY 
5 个 括 : 国家 财政 性 教育 经 费 (X1)， 民 
(Xs)， 社 会 捐赠 经 Cx 
他 教育 经 费 (X6)、 妾 


事业 收入 (包括 学 杂费 ) (Xs)、 教 育 经 费 
三 42 中 列 出 了 2013 年 22 个 省 、 市 、 自 治 区 地 





方 高 等 学 校 教育 经 费 收入 的 数据 资料 试 进行 对 应 分 析 沁 挤 示 地 方 高 等 学 校 教育 经 费 收入 


的 特征 及 各 省 、 市 、 自 









治 区 与 各 收入 变 基 间 的 关系 *X 六 
-42 2013 年 全 国 各 地 区 教育 从 要 情况 调查 结果 












(单位 : 万 元 ) 










































































序号 XI1 x X4 eo] xX6 
1 8941899 3384 2 了” 8560 855343 748212 189180 
2 4986021 782 7631 632387 529025 72795 
3 8523960 50262 6637 1606017 1386046 111267 
4 5546840 9453 4017 515753 406458 45496 
5 7766499 19214 2074 1415382 1170479 98894 
6 5126395 2380 1368 836690 757361 39425 
7 7640400 735 6397 1141498 950523 280686 
8 江苏 15765569 71191 123770 3168318 | 2444601 733987 
9 浙江 10890610 35855 56997 2780301 2273707 726676 
10 安徽 8594589 46870 14121 1638949 1276090 118515 
11 福建 6514206 78321 46843 1431102 1088793 157540 
12 江西 6932770 26897 9378 1214374 953006 101576 
13 山东 14995863 57610 27202 2562457 | 2023150 153030 
14 湖北 6697669 96561 16042 1811299 1434060 350709 
15 湖南 8449160 63437 14113 1978319 1549244 279523 





资料 来 源 :《 中 国 统计 年 鉴 (2015)》 
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1. 实 训 项 目 : 对 应 分 析 在 外 语 学 习 需 求 分 析 中 的 运用 

实 训 目的 : 学 会 运用 对 应 分 析 的 原理 和 方法 解决 定性 数据 的 分 类 和 对 应 问题 。 

实 训 内 容 : 设计 并 组 织 针对 你 所 在 年 级 非 英 语 业 学 生 的 学 习 需 冰 调 查 。 数据 采用 问 
卷 形式 获得 ， 旨 在 了 解 学 生 学 习 外 语 的 资源 、 时 间 、 动 机 、 收 获 、 学 习 困 难 、 学 习 策略 及 
对 拟 进行 的 课程 改革 的 态度 等 。 可 分 成 研究 小 组 ， 每 组 选择 其 中 的 两 个 变量 进行 研究 。 例 
如 ,学生 学 习 英 语 的 动力 及 学 生 每 周 课外 学 习 英 语 的 时 间 。 学 习 英 语 的 动力 可 分 为 3 个 层 
次 : 比 第 一 学 期 强 、 与 第 一 学 期 一 样 、 比 第 一 学 期 弱 ， 学 生 每 周 课外 学 习 英语 的 时 间 分 为 
4 个 层次 : 1 一 2 小 时 、3 一 4 小 时 ，5 一 6 小 时 、7 小 时 以 上 。 So 

学 习 动力 与 TT i 联系 ,联系 有 什么 
趋势 ? 

2. 实 训 项 目 : 大 学 本 科 生 对 毕业 后 就 业 看 法 的 对 

实 训 目的 : 学 会 运用 对 应 分 析 的 原 更 和 方法 解决 定 "i 

实 训 内 容 : 组 成 调研 小 组 ， 从 所 在 专业 机 抽取 一 至 四 年 级 的 学 生 若干 人 。 按 年 级 
分 为 4 组 ， 对 毕业 后 有 4 种 不 同 的 看 法 ， "世上 信心 、 信 心 不 大 、 没 信心 和 说 不 清楚 ， 试 
对 调研 数据 进行 对 应 分 析 。 RNe 
3. 实 训 项 目 ， 对 全 类 分 析 作 避 小 帮 对 应 分 析 并 相互 地 聊 
实 训 目的 ， 学 会 运用 对 党 条 杀 原 理 和 方 尖 泊 得 禾 局 的 分 类 和 对 应 同 是， 能 够 区 
分 对 应 分 析 和 上 聚 类 分 析 同 。 

实 训 内 容 : 选择 第 7 全 中 放 0 2、3 中 的 一 题 ， 将 其 改 为 对 应 分 析 ， 
并 与 聚 类 分 析 结 者 果 进 行 比 较 。 站 


3 A 
[人 案例 让 者 与 讨论 
对 应 分 析 在 我 国 寿险 公司 偿付 能 力 检 测 中 的 应 用 


偿付 能 力 是 指 保险 公司 对 其 所 称 的 保险 责任 在 发 生 赔 偿 或 给 付 时 所 具有 的 经 济 补偿 能 
力 ， 是 保险 公司 经 营业 绩 的 体现 ， 也 是 政府 对 保险 业 进行 监管 的 重点 。 保 险 公司 能 否 履 行 
合同 的 规定 义务 ， 要 看 它 有 无 足够 的 承担 赔偿 或 给 付 的 偿还 能 力 。 被 保险 人 的 利益 能 否 得 
到 保障 就 取决 于 保险 公司 是 否 具有 足够 的 偿付 能 力 。 因 此 ， 如 何 对 保险 公司 的 偿付 能 力 进 
行 检测 ， 并 有 效 地 加 强 监 管 力度 是 需要 研究 的 。 

要 实现 对 寿险 公司 偿付 能 力 检 测 的 量化 分 析 。 寿险 要 建立 一 套 科学 指标 ， 并 结合 中 
Pm tt gg tr a 
指标 尽 可 能 考虑 到 影响 偿付 能 力 的 各 个 方面 ， 与 拟 采 用 的 分 析 方法 相 适 应 。 


nt 
































i 
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Xi 一 一 投资 收益 与 保费 收入 之 比 ; 
X6 一 一 流动 性 比率 ， 等 于 平均 流动 资产 与 平均 总 资产 之 比 ; 


X7 
Xs 








寿险 责任 准备 金 增 额 对 寿险 保费 收入 之 比 ; 
保费 收入 与 寿险 市 场 的 总 保费 收入 之 比 。 


原始 数据 表 的 建立 如 表 9 一 43 所 示 。 


表 9-43 12 家 人 寿 保 险 公 司 的 资产 









































保险 公司 xX xX: Xs Xs Xs Xe X7 Xs 

中 国人 寿 | 0.0300 | 0.0699 | 1.0215 | 0.0062 | 0.0172 | 0.6775 | 0.6725 0.7522 
太保 人 寿 | 一 0.0444 | 一 0. 0850 0. 8935 0. 0000 0.0334 0. 8464 0.6738 0.1455 
新 华人 寿 | 0. 1135 0. 2325 1.1043 0.0008 0.0019 1; 和 0. 5841 0. 0466 
泰康 人 寿 | 0.0976 0.1818 1.0852 | 一 0.0446 | 0.0229 /0. od6d 0.7375 0. 0383 
太平 人 寿 | 0.1633 | 0.2395 | 1.1890 | 一 0.0551 | 0.0125 .5405 | 0.8805 0. 0097 
中 宏 人 寿 | 0. 3156 0.7456 1.4508 | 一 0.0480 RT 0. 4968 0. 4069 0. 0024 
太平 安泰 | 0.3430 | 0.6825 1.4889 | 0.1590 Sm 0.6882 | 0.5301 0. 0026 
安 联 大 众 | 0. 3277 1.0085 1.4798 b 0.0172 | 0.6613 | 0.7838 0. 0007 
金 感人 寿 | 0.7095 | 3.7865 | 3.4254S 4516 | 0.0000 | 0.5537 | 0.4731 0. 0005 
中 保 康 联 | 0.9127 | 14.2440 | lay RN 一 0.8887 | 0， 1857I 0 7244 | 0.3070 0. 0001 
信 诚 人 寿 | 0.7007 人 03152| TA.1326 | 一 0. 1789 | 0 Go00) 0. 8001 0. 3485 0. 0012 
恒 康 天 安 | 0.8691 | 7.5630 | 7.4116 | 一 9.9169| ‘0X2621 | 0.5749 | 0.5609 0. 0001 





























数据 来 源 :根据 32003 中 国保 险 年 鉴 ) 中 主要 的 记 家 人 寿 保险 公司 的 资产 负债 表 和 损益 表 的 有 关 





YY 
据 让 给 另外 ,平安 保险 公司 经 营 寿险 和 财 险 的 集团 公司 ， 专营 的 这 部 分 数据 不 能 
取 ， 因 而 这 里 暂 不 考虑 这 家 公司 。 


需要 思考 与 讨论 的 问题 如 下 : 

(1) 采用 对 应 分 析 方 法 对 寿险 公司 偿付 能 力 进行 量化 分 析 ， 得 到 对 应 分 布 图 。 如 何 根 
据 对 应 分 布 图 实现 对 样品 和 变量 的 分 类 ? 

(2) 根据 上 面 分 类 结果 讨论 我 国 主要 寿险 公司 的 偿付 能 力 与 实际 的 监管 要 求 之 间 是 否 
有 差距 ?如 存在 差距 ， 人 寿 保 险 公司 应 该 怎样 提高 偿付 能 力 ? 

( 注 : 本 案例 选 自 暨 南大 学 精品 课程 网 站 一 一 多 元 统计 分 析 ) 
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综合 案例 与 分 析 


| 才学 ED ,从 


入 
< 六 
通过 本 章 的 学 习 ， 使 学 生 系统 地 这 所 统计 学 的 原理 和 支 法 SN 笠 合 合 运用 已 学 过 的 统计 方法 来 
解决 实际 问题 。 SG 


| kD XS 


娄 求 学 生 能 够 根据 研究 目的 确定 选 题 K 制 定 出 一 个 周密 的 统计 调查 方案 并 设计 问卷， 利用 
SPSS 统计 分 析 软件 对 所 收集 到 的 样本 教 乌 进 行 描述 性 和 推断 性 统计 分 析 ， 写 出 统计 调查 报告 。 

实践 性 是 应 用 统计 学 鲜明 的 学 科 圣 点 ， 本 章 是 为 了 帮助 学 生 正 确 运 用 应 用 统计 学 闻 的 思想 与 
方法 ， 加 强 理论 联系 实际 而 编写 的 所 选 案例 来 自 天 津 第 哇 党 开 企 业 管理 咨询 有 限 公 司 ， 有 站 
实 的 背景 。 相 信和 学 生 在 学 河 箭 面 各 说 节 内 容 的 基础 上 分断 讨论 这 个 案 全 ， 会 领略 到 应 用 统计 学 
的 特点 及 精髓 。 ”> 人 AN 








WX、 2 
入 
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统计 学 在 天 津 市 房地产 市 场 营销 中 的 应 用 


随 着 天 津 市 城市 居民 全 面 进入 小 康生 活水 平 ， 住 房 消费 已 经 并 在 今后 若干 年 内 将 持续 成 为 天 津 市 城 
市 居民 的 消费 热点 。 在 改善 城市 居民 生产 生活 条 件 、 拉 动 经 济 增长 、 吸 纳 就 业 等 方面 ， 房 地 产业 也 必 将 
在 整个 国民 经 济 中 占据 更 加 重要 的 地 位 。 同 时 ， 城 市 居民 消费 水 平 的 不 断 提 高 、 住 房 消费 市 场 的 不 断 发 
育成 熟 、 市 场 竞争 环境 的 激烈 程度 不 断 加 大 ， 对 各 个 房产 开发 企业 提出 了 新 的 挑战 。 企 业 要 更 加 重视 市 
场 和 客户 的 需求 ， 对 市 场 的 各 种 变化 需要 充分 的 信息 支持 和 准确 的 市 场 判断 。 

为 了 帮助 房地产 企业 了 解 天 津 市 市 区 消费 者 对 房地产 产品 的 需求 状况 ， 制 订 相 应 的 投资 、 开 发 、 销 
售 策略 。 天 津 市 某 统 计 管理 咨询 有 限 公 司 在 天 津 市 市 区 进行 了 抽样 调查 ,， 讽 希 未 帮助 地 产 企 业 了 解 、 分 
析 、 研 究 当地 房地产 宙 场 情况 。 通 过 本 次 调研 了解 天 津 市 市 区 房 地 疗 多才 来 当下 明确 投资 方向 

本 案例 需要 分 析 的 问题 如 下 ; 

(1) 拟定 市 场 调研 方案 。 SR 

(2) 进行 调研 问卷 设计 并 搜集 样本 数据 。 NY 

(3) 进行 统计 分 析 。 AN 


天 

从 菜 种 意义 上 讲 ， 房 地 产 企业 芝 信 于 于 销售 和 推销 ， 它 首先 是 在 对 市 场 的 深刻 理解 
的 基础 上 的 高 智能 的 策划 。 它 车 全 交房 地 产 企业 生产 开发 归 党 的 全 过 程 ， 由 市 场 调查 、 方 
案 制 订 和 建筑 总 体 设计 、 价 格 定 位 广告 中 介 服 务 、 后 服务 及 信息 反馈 等 组 成 。 如 果 我 
们 不 能 正确 理解 营销 是 房地产 企业 最 本 质 的 职能 ， 真 是 到 了 应 该 出 售 自己 产品 的 时 候 才 来 
组 织 推销 ， 那 么 ， 你 的 楼 宇 就 很 难 适 合 市 场 需求 以 这 种 生产 开发 的 育 目 性 ， 必 然 会 导致 销 
售 的 无 的 放 矢 A 
全 应用， 其 研究 成果 对 于 房地产 企业 具有 而 朗 的 现实 意义 。 

4 





LA 实例 分 析 上 
一 、 天 津 市 某 房地产 市 场 调研 方案 的 拟定 
(一 ) 调研 的 目的 
(1) 了 解 天 津 市 购房 考 的 分 布 和 特征 。 
(2) 研究 、 确 定购 房 者 的 需求 档次 和 需求 价位 上 限 。 
(3) 研究 本 案例 的 价格 敏感 度 ， 为 房产 定价 提供 科学 的 依据 。 
(4) 了 解 影响 潜在 消费 群体 决策 的 主要 因素 。 
(5) 定位 本 案例 的 潜在 消费 群体 ， 了 解 其 需求 的 基本 特征 及 特殊 消费 需求 。 
(6) 了 解 目标 地 块 的 优势 和 不 足 及 潜在 消费 群体 对 此 问题 的 看 法 。 
(7) 了 解 现实 消费 者 对 成 熟 楼 盘 的 满意 程度 ， 发 握 其 尚未 满足 的 需求 方面 。 
(8) 了 和 解 购房 者 对 户型 、 房 型 的 需求 特点 ， 以 及 对 服务 的 要 求 。 
(二 ) 调研 的 内 容 
(1) 天 津 市 购房 群体 的 特征 描述 ， 包 括 收入 水 平 、 消 费 习惯 、 生 活 习 惯 、 现 有 居住 状 
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况 、 交 通 工具 的 拥有 和 使 用 状况 。 

(2) 购房 群体 的 职业 、 地 域 分 类 及 购房 目的 。 

(3) 购房 群体 对 住宅 的 一 般 需 求 ， 如 房屋 质量 、 交 通 便利 度 、 公 共 设 施 完备 度 、 物 业 
管理 的 要 求 。 

(4) 购房 群体 对 住宅 特殊 需求 ， 如 安 人 全、 环境、 建筑 风格 、 文 化 氛围 、 品 位 档次 的 
要 求 。 

(5) 购房 群体 对 楼 盘 的 价格 的 敏感 度 ， 以 及 购买 的 承受 能 力 。 

(6) 购房 群体 对 现 有 成 熟 楼 盘 房 型 、 户 型 的 评价 。 

(7) 购房 群体 获得 房地产 信息 的 渠道 及 信赖 程度 和 媒体 消费 特征 。 

(8) 购房 群体 对 购房 付款 方式 的 意愿 。 

(9) 影响 购房 群体 购房 的 主要 因素 分 析 。 A 

(三 ) 调研 的 对 象 入 

(1) 购买 群体 。 购 买 群体 主要 为 已 经 购买 了 住房 的 人 全 生生 丰 和 
方 米 4500 元 以 上 。 户 主 应 为 年 龄 在 35 一 50 岁 ， Ve 0 7000 元 。 

(2) 潜在 购买 群体 。 AN 竹 月 收入 水 平 超过 每 月 7000 元 。 

(四 ) 调研 的 方法 i 

1. 定量 调查 

调查 的 方法 : nA ns 买 群体 一 一 工作 单位 内 面 访 或 预约 
访问 。 和 XXX、 

@ 购买 群体 调查 : 人 人 i 选择 配额 为 年 龄 35 一 5 
岁 ， 月 收入 水 平 超过 70 Ww 人 

实施 计划 : 问卷 式 入 户 二 问 ， 必 站 个 

@ 洪 在 购买 群体 调查 : 根据 洪 在 购 湛 秆 休 的 职业 特征 ， 在 市 区 寻找 相应 的 单位 ， 
工作 单位 内 面 该 约 访问 的 调查 方法 进行 访谈 。 这 样 便于 找到 被 访 者 ， be 

实施 计划 : 采用 问卷 式 面 访 ， 样 本 为 30 个 。 

2. 数据 分 析 

采用 市 场 调查 常用 的 分 析 研究 方法 进行 数据 分 析 ， 主 要 应 用 因素 分 析 方 法 、 价 格 敏 感 
度 测试 、 对 比 研究 方法 、 统 计 描述 研究 方法 等 。 

(五 ) 报告 内 容 

报告 内 容 略 。 

(六 ) 项 目 流程 

(1) 前 期 准备 阶段 。 

(2) 与 客户 充分 沟通 ， 制 订 调 研 方 案 。 根据 调 研 目 标 细 化 调研 提纲 。 执 行 阶段 设计 调 
查 提纲 和 调查 问卷 ; 根据 方案 实地 调查 ,控制 质量 。 

(3) 数据 分 析 阶段 。 将 收集 的 数据 输入 计算 机 ,运用 相关 统计 软件 进行 分 析 汇总 。 

(4) 整理 提交 报告 。 在 前 一 阶段 工作 的 基础 上 ,将 撰写 的 报告 提交 客户 ,可 根据 需要 
提供 报告 的 讲解 。 

(七 ) 调研 时 间 

整个 调研 预计 时 间 30 个 工作 日 。 
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表 10-1 项 目 进程 表 
项 目 进程 第 1~5 天 | 第 6~8 天 | 第 9~15 天 | 第 16 天 | 第 7~22 天 | 第 23 一 29 天 | 第 30 天 
制订 方案 、 问 卷 设计 、 
确定 问卷 

试 访 、 问 卷 调整 
案头 研究 @ @ 
访 员 培 训 、 试 访 @ 
访问 阶段 @ @ 
问卷 审核 、 复 核 @ @ 
@ 
@@ 























中 期 汇报 
数据 编码 输入 





el ele 





修改 
提交 报告 » NN @ 


报告 撰写 与 沟通 、 。 < @ 
\ 


























(人 入) 执行 过 程 Rw 
. 项 目 过 程 SS x 、 


a 与 容 并 沟通 ”探讨 方案 ; 克扣 入 廊 案 和 培训 手册， 按 客户 要 求 
设计 问卷 ; 问卷 印刷 。、 了 一 

(2) 项 目 开始 : 公司 中 ST 对 发 现 的 问题 进行 
再 培训 、 ee 正式 访问 。 闵 旋 》 

(3) 回收 | PP 

Tn 
码 输入 ， 数 据 处 理 。 

(4) 报告 阶段 。 

2. 访问 流程 

内 部 制订 访问 员 手 册 、 抽 样 方案 、 培 训 方 案 、 访 问 进程 安排 ;审核 样本 ， 确 定 培训 时 
间 ; 组 织 访问 员 培 训 ; 访问 员 试 访 ， 考 核 、 调 整 访问 员 ; 访问 对 象 的 寻找 与 预约 ; 正式 访 
问 ， 督 导 陪 访 ; 随时 了 解 访问 员工 作 情 况 ; 按时 间 安 排 交卷 ， 控 制 进度 ; 审核 问卷 调整 
访问 员 ; 强调 注意 问题 ， 随 时 复核 ; 多 次 分 批 交卷 ,当场 审核 、 处 理 情况 ; 按 进 度 安 排 ， 
访问 结束 ; 开始 复核 。 

( 九 ) 质量 控制 

(1) 制订 调查 质量 控制 细则 。 

(2) 选 样 与 调查 分 离 ， 保 证 选 样 的 准确 性 。 

(3) 对 回收 的 问卷 进行 100 吧 的 审核 和 复核 。 其 内 容 包 括 核查 样本 数量 和 样本 分 布控 
制 ， 核 查访 问 员 是 否 按 要 求 寻 找 被 访问 者 ， 核 实 必 填 项 目 是 否 填写 完整 ， 检查 所 有 答案 是 
否 真实 记录 ， 检 查 开放 性 问题 的 填写 质量 。 
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(4) 抽查 工作 在 访问 期 间 进行 ， 及 时 规范 调查 行为 。 

所 有 前 后 不 一 致 及 有 问题 的 访问 ， 或 有 其 他 导致 对 某 访 问 员 访问 工作 有 怀疑 的 情况 ， 
该 访问 员 的 所 有 问卷 必须 经 过 彻底 抽查 。 如 果 在 抽查 后 发 现 有 其 他 问题 ， 该 访问 员 的 所 有 
问卷 必须 全 部 作废 ; 如 果 发 现 访问 员 有 作 准 的 情况 ,该 访问 员 的 所 有 问卷 也 必须 全 部 作 
废 ; 上 述 两 种 访问 员 不 能 继续 进行 访问 工作 ,而 应 使 其 他 访问 员 按 原来 的 抽样 要 求 及 采访 
要 求 重新 进行 访问 ， 替 换 作废 问卷 。 

(5) 项 目 管理 流程 如 图 10. 1 所 示 。 














图 10.1 项 目 管理 流程 /<< 
SN 


(十 ) 调研 费用 人 


调研 费用 预算 表 如 表 10 -2 所 示 。 SA 


表 10-2 ee 预算 表 
项 目 金额 /元 
3000 



































项 目 设计 费 方案 梁 计 、 问 卷 设计 。 _。 
消费 者 访谈 |” YX 元 /个 样 木 X100 个 7\ 8000 
数据 处 理 分 析 区 人 人 站 和 x5 昭 0 a 500 
报告 费用 , 惟一 研究 报告 撰写 费 / 15000 
项 目 费用 4 ~ :不 26500 
LINE | 项 目 费 类 并 7%% 1855 
费用 合计 , 20000 


二 、 天 津 市 河西 区 某 房地产 市 场 调研 问卷 设计 
问候 语 


先生 /女士 : 
您 好 ! 我 是 天 津 昂 赛 瑞 企业 管理 咨询 有 限 公司 的 访问 员 ， 我 们 正在 进行 一 项 有 关 天 津 


市 住宅 市 场 的 研究 ， 想 听 听 您 或 您 家 人 的 意见 ， 您 的 意见 对 于 我 们 的 研究 非常 宝贵 ， 和 希望 


耽误 您 一 点 点 时 间 跟 您 谈 谈 ， 可 以 吗 ? 谢谢 ! 
您 个 人 的 资料 我 们 不 会 单独 使 用 ， 我 们 所 做 的 调查 对 您 和 您 的 家 人 都 没有 任何 不 良 影 


甄别 问卷 
Sl. 请 问 您 在 天 津 市 拥有 自己 的 住房 吗 ? 
耕 2 【终止 访问 】 


响 ， 请 您 放心 ! 
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S4. 


2 
ba 


S7. 


S8. 


S9. 


. 请 问 您 是 










家 购房 的 决策 人 或 者 户主 吗 ? 








. 请 问 您 的 年 龄 是 : 


50 岁 以 上 


请 问 您 或 您 的 家 人 有 在 下 列 行业 工作 的 吗 ?【 复 选 了 

报社 /电视 台 / 电 台 /杂志 社 /调查 公司 ………… 1 
房地产 销售 /策划 /广告 /顾问 公司 …………… 
房地产 开发 /建筑 /规划 设计 /物业 管理 公司 
房地产 交易 /国土 /规划 /建设 管理 机 构 … 








1 


3000 一 4000 元 
2000 一 3000 元 
2000 元 以 下 

请 问 您 全 家 开 均 区 月 的 总 收入 是 ? 【 单 选 开 





ny 1 




















7000 元 及 避 沁 os 6 
6000 一 7000 元 5 
5000 一 6000 元 4 
3000 一 5000 元 3 
2000 一 3000 元 2 
2000 元 以 下 | 
请 问 您 有 改善 现 有 住房 即 重新 购房 的 打算 吗 ? 
SD 
2 
请 问 您 有 购买 第 二 居所 /投资 购房 的 打算 吗 ? 





主体 问卷 











在 主体 问卷 部 分 ， 首 先 应 设计 问卷 结构 ， 然 后 设计 问卷 。 由 于 篇 幅 所 限 ， 
C、 J 部 分 的 部 分 主体 问卷 ， 其 他 部 分 略 。 








【终止 访问 】 
【终止 访问 】 
【终止 访问 】 
【终止 访问 】 
【终止 访问 】 


【终止 访问 】 
【终止 访问 】 


请 问 您 在 最 过半 年 之 内 是 否 接受 过 有 关 房地产 方 泊 的 内 研究 活动 ? 


【终止 访问 】 


【终止 访问 】 
【终止 访问 】 
【终止 访问 】 


【终止 访问 】 
【终止 访问 】 
【终止 访问 】 
【终止 访问 】 


【终止 访问 】 


【 焉 问 主体 问 老 】 


只 列 出 A、 


A. 对 现 有 住房 的 认 知 ; B. 住房 需求 特征 ; 
小 区 周边 环境 及 交通 条 件 需 求 ; 下 . 
他 因素 ; HH. 付款 要 求 ; 
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C. 对 概念 的 认 知 与 价格 敏感 度 分 析 ; D. 
小 区 内 环境 需求 ; F. 户型 需求 ; G. 购房 时 考虑 的 其 
I. 物业 管理 ; J]. 消费 者 购房 认 知 。 


A. 对 现 有 住房 的 认 知 


(1) 请 问 您 心中 最 理想 的 居住 区 域 在 哪里 ?〖【 复 选 】 


(2 


(3 


(4 


》 








01 
… 02 
5 
河西 区 东部 Sy 向 训 
近郊 梅 江 地 区 pp 55 省 


河北 区 

河东 区 

永 下 区 胃 桩 遂 | 3indiis 08 
河西 区 的 海河 边 ee 09 
他 (六 汪 2 10 


二 总 昌 中 的 小 区 应 具备 呈 上 条件 复 洁 ]C、 














安静 不 噶 杂 “01 购物 方便 

离 公园 /风景 区 近 .02 人 

周边 绿化 较 好 能 看 到 远景 的 高 层 住宅 12 
小 区 内 绿化 率 高 治安 环境 好 13 
有 较 好 的 物业 管理 案 半 nn 14 
公寓 内 有 华丽 大 堂 小 区 配套 智能 化 二 
靠 河 边 居住 人 人群 将 次 接近 i 16 
具有 栓 面 外 现 的 高 层 志 训 和 高 小 度 会 所 ss 17 
交通 方便 sr i 18 








Ne 


DA 
CE 
vy 人 





购买 第 二 居所 09 
需要 更 合理 的 户型 10 
投资 保值 增值 “11 
用 于 出 租 过 
现 住房 要 拆迁 13 
为 了 户口 14 


其 他 (请 注 明 ) 


您 居住 ?【 单 选 】 


梅 江 居 住 区 …… 
黑 牛 城 道 一 带 
解放 北 路 一 带 … 


入 
请 问 您 打算 购房 /改善 住房 的 是 出 于 下 列 那些 原因 呢 ?【 复 选 】 
改善 住房 景观 :01 
改善 居住 环境 档次 * 02 
生活 配套 更 方便 03 
和 老人 分 开 住 “04 
为 子女 结婚 用 “05 
为 孩子 上 学 和 教育 * 06 
离 工 作 点 近 07 
和 老人 一 块 儿 居 住 * 08 
请 问 您 觉得 天 津 河 西区 哪 一 个 路 段 最 适合 
大 沽 路 一 带 . esat 1 
友谊 路 一 带 2 
海河 边 ……… 3 
体 院 北 附近 …… | 








其 他 (请 注 明 


(5) 请 问 您 购买 住宅 的 居住 方式 是 下 列 哪 种 情况 ?【 单 选 】 





| 371 


372 | 应 用 统计 学 (第 3 版 ) »》 











> 夫妻。 蕊 子 。 父 母 三 代 人 同 住 www* 了 7 
夫妻 孩子 两 代 人 同 住 和 夫妻 、 孩 子 、 见 弟 姐妹 、 父 母 同 住 … 8 
六 针 油 入 信 otsvarisins 4 用 来 出 租 / 经 商 /投资 等 …………….…… 9 
Et 5 其 他 (请 注 明 ) “0 


C. 对 概念 的 认 知 与 价格 敏感 度 分 析 


(6) 下 面 是 有 关 一 个 住宅 小 区 的 一 些 描述 ， 请 告诉 我 您 的 鞠 成 程度 ?【 单 选 】 


















































[ ] 小 型 化 小 区 ， 总 的 户 数 和 人 口 不 会 很 多 5 NY 3 到 1 
[ 了] 现代 化 小 区 、 赵 高 层 (30 层 以 上 ) 远景 观 yr 3 2 1 
[ J 所 有 住房 精装 修 NAH ， 3 2 1 
] 靠近 市 中 心 ， 交 通 比 较 方便 p、 入 4 3 2 1 
每 套房 子 都 能 看 到 水 车 SS 5 1 3 2 1 

] 每 天 都 能 呼吸 到 新 鲜 的 室 气 1T \ 5 .| 3 2 1 

[ J] 有 高 档 业主 会 所 ， 共 业主 休闲 $ 娱乐 使 用 NL 4 3 2 1 
[ J] 商 层 住宅 一 楼 有 集 丽 的 天 盈 本 eA | 4 3 2 1 
[ 机 下 和 牟 5 1 3 2 1 
] 是 外 观 设 i 的 高 层 住宅 & 4 和 2 1 

[ J] 绿地 面积 较 多 ， 有 较 好 的 活动 空间 5 4 3 2 1 
[ ] 房型 设计 新 颖 实用 ， 充 分 考虑 生活 方便 性 5 1 3 2 1 
[ ] 优秀 、 周 到 的 物业 管理 5 1 El 2 1 


























(7) 假如 有 一 个 小 区 ， 位 于 河西 区 中 部 ， 靠 近 市 中 心 ， 紧 挨 着 海河 ， 其 品味 档次 与 您 
理想 中 的 小 区 别 无 二 致 ， 甚 至 超过 您 对 小 区 的 想象 ， 价 格 适中 ,请 问 您 在 这 里 购房 与 投资 
的 可 能 性 有 多 大 ?【 单 选 】 

比较 有 可 能 … 
可 以 考虑 
不 可 能 
非常 不 可 能 pp ] 


(8) 请 问 您 可 以 接受 的 购房 房价 为 多 少 呢 ?【 单 选 】 











和 罗京 | 8 





























综合 案例 与 分 析 
能 接受 的 最 高 房价 柱 ” 房 

50 万 元 及 以 下 01 

50 万 一 60 万 元 02 

60 万 一 70 万 元 03 

70 万 一 80 万 元 04 

80 万 一 90 万 元 05 

90 万 一 100 万 元 06 
100 万 一 120 万 元 07 

120 万 元 以 上 08 








(9) 针对 上 述 房屋 总 价 ， 您 考虑 购买 多 少 平方 米 的 房屋 ? 和 能 告诉 我 准确 的 面 
积 吗 ? Se 


面 积 < T 选 项 


80m? 以 下 a 1 


TF ? 


RA 
90~100m? gs ZL 3 
SR 








80 一 90m2 

















100 一 120m 4 
120~140nm%、 >、\ -| 5 
SE z ts 
140~l60m*, ,AY 6 
160 二 180m? 总 








A 
oon SN > a 
9 


PP 


doom dt yx 





/ [ 
(10) 请 问 ， 您 选择 购买 房屋 的 主要 因素 是 什么 ?【 复 选 至 少 选 3 个 】 



































购房 因素 

[ ] 开发 商 信 誉 、 品 牌 和 实力 01 
[ ] 住房 的 视野 和 景观 02 
[ ] 地 理 位 置 03 
[ ] 公共 交通 条 件 04 
[ ] 周边 自然 环境 05 
[ J 周围 生活 设施 配套 情况 06 

小 区 内 的 景观 和 环境 07 

小 区 内 配套 08 
[ ] 建筑 外 观 风格 09 
[ ] 室内 户型 结构 10 
[ ] 房屋 使 用 率 11 














其 他 (请 注 明 ) 12 
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(11) 下 面 我 会 读 出 一 些 有 关 住房 的 说 法 ,请 您 告诉 我 您 的 同意 程度 。〖【 单 选 
























































非常 | 比较 | 说 | 不 太 | 非常 

同意 | 同意 | 不 清 | 同意 | 不 同意 
[ 豪华 、 尊 贵 ， 是 身份 的 象征 5 4 3 交 1 
[ 。 ] 隔离 城市 喧嚣 ， 亲 近 大 自然 5 4 3 2 1 
[ 住 在 市 中 心 高 楼 大 厦 ， 高 高 在 上 5 4 3 2 1 
[。 ] 可 体验 时 尚 、 新 潮 的 生活 方式 5 4 3 2 1 
[ ] 私密 性 好 ， 有 完全 自由 的 空间 5 4 r3 2 1 

] 清净 悠闲 劳累 之 余 可 以 尽情 放松 5 ,cS 2 

上 保安 设施 完善 5 NS | 3 和 1 
[ 。 ] 建筑 外 观 在 未 来 可 以 保持 不 落后 NE 3 2 1 
[了 开发 商 提供 本 装修 ， 增 加 蝇 体 价值 。 | 4 3 2 1 
[ 。 ] 有 利于 健康 的 环境 设施 《A Ns 4 3 2 1 





NS 
0 人 其 定价 会 在 每 站 访 米 5000 一 8000 元 ， 请 考虑 总 


面积 请问 当 总 价格 高 到 多 几时 7 自 会 觉得 无 法 拉 党 哆 7 当 已 价格 高 到 多 少时 ， 您 还 可 以 
接受 ? 您 觉得 最 合适 汉人 术 为 多 少 【章法 eR 
































能 接受 的 最 高 房价 高 得 无 法 接受 “| 高 但 能 接受 最 合适 
40 万 元 ol | 01 01 
40 万 一 50 万 元 02 02 02 
50 万 一 60 万 元 03 03 03 
60 万 一 70 万 元 04 04 04 
70 万 一 80 万 元 05 05 05 
80 万 一 90 万 元 06 06 06 
90 万 一 100 万 元 07 07 07 

100 万 一 120 万 元 08 08 08 

120 万 元 以 上 09 09 09 











(13) 仍 以 河西 区 某 地 的 无 配 住房 为 例 ， 它 靠近 海河 ， 是 超过 30 层 的 超 高 层 建筑 ， 房 型 
和 外 观 设计 现代 、 高 档 ， 拥 有 别 的 住宅 很 难 比 拟 的 远景 和 视野 ， 使 人 心旷神怡 。 它 的 设计 充 
分 考虑 了 购房 者 的 需求 。 请 问 您 觉得 它 的 定价 应 该 在 每 平方 米 多 少 钱 最 合适 ? 当 价 格 高 到 多 
少时 ， 您 会 觉得 无 法 接受 呢 ? 假设 您 购买 ， 您 觉得 价格 为 多 少时 ， 您 肯定 会 购买 ?【 单 选 】 
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能 接受 的 最 高 房价 最 合适 高 得 无 法 接受 高 但 能 接受 

4000 元 及 以 下 01 01 01 
4000 一 4500 元 02 02 02 
4500 一 5000 元 03 03 03 
5000 一 5500 元 04 04 04 
5500 一 6000 元 05 05 05 
6000 一 6500 元 06 06 06 
6500 一 7000 元 07 07 07 

7000 元 以 上 08 08 08 








本 消费 者 购房 认 


rg 
(14) 下 面 是 人 们 购房 时 的 一 些 看 法 ， 请 根据 您 自己 的 情况 图 出 您 对 每 一 句 话 的 殉 成 
程度 。 【请 被 访 者 从 打 钧 处 开始 选择 ， 注 意 


从 





Ol 





















































SS 
Xs | 不 同意 有 些 | 有 些 同意 非常 
SH 不 同意 | | 不 同意 | 同意 同意 
, 我 购买 房 和 首先 孝 克 地 让 CT 2 3 4 5 6 
2. 我 部 戏 住 在 即 区 , SS 区 2 3 4 5 6 
机 [ 有 1 3 4 5 6 
[ 4.) 交通 方便 ， 住 哪里 都 可 以 1 有 3 4 5 6 
[ ] 5. 我 购买 房子 很 少 考虑 地 段 1 2 3 4 5 6 
[ J] 6. 如 果 有 足够 的 钱 ， 我 会 买 高 档 公寓 2 3 4 5 6 
房 [ ] 7. 房型 是 决定 我 购房 的 首要 因素 1 2 3 4 5 6 
[ 8. 我 不 喜欢 高 档 公 寅 ， 一般 公寓 就 行 1 2 3 4 5 6 
型 | [ ] 9. 我 买房 不 管 地段 ， 只 要 房型 好 就 行 1 2 | s 4 5 | 6 
[ ] 10. 房型 合适 ， 面积 小 一 点 也 无 所 谓 | 2 3 4 5 6 
[ 11. 小 区 周边 应 该 有 比较 好 的 娱乐 、 运 i g a 
动 、 休 闲 场 所 
多 12. 小 区 内 部 的 停车 位 要 充足 1 2 9 4 5 6 
境 13. 小 区 的 空地 要 随时 能 看 到 绿地 1 2 3 4 5 6 
[ 14. 高 档 会 所 是 高 档 小 区 必 不 可 少 的 设施 1 2 3 4 5 6 
[ 15. 小 区 要 有 室内 游泳 池 1 4 El 6 
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( 续 ) 
些 些 

16. 户型 只 要 好 ， 贵 一 点 也 无 所 谓 1 2 3 4 5 | 6 

户 | [5 ] 17. 户型 无 所 谓 ， 只 要 面积 大 就 行 1 2 3 4 5 | 6 
18. 我 买房 最 先 考虑 户型 1 2 3 4 5 6 

型 | [ ] 19. 我 喜欢 超 高 层 房子 的 远景 观 1 2 3 4 5 | 6 
[ ] 20. 我 喜欢 所 有 的 房子 在 同一 层 上 1 2 3 4 5 | 6 

[ ] 21, 我 买房 ， 先 考虑 好 面积 再 看 房型 2 3 4 5 6 

而 | 5 ] 22 房子 趋 大越 好 1|: | 5 | 4 
[ ] 23. 我 不 喜欢 太 大 的 房子 1 /A | 4 5 6 

积 | [5 ] 24. 面积 小 一 点 无 所 谓 ， 功 能 要 齐全 eh 3 4 5 6 
[”] 25. 我 买房 时 房屋 总 价格 对 我 很 重要 KY | ; 3 4 区 

[ “] 26. 我 喜欢 装修 豪华 的 房子 vw TAN 3 4 5 | 6 

档 27. 如 果 能 力 的 话 ， 我 会 买 最 好 的 3 1 4 3 4 5 6 
Te 1 3 4 5 | 4 

次 | [5 ] 29. 住房 好 坏 没什么 ! 只 要 够 住 就 行 3 | 4 | 5 | 
30 住房 档次 高 在 员 用 而 前 才 有 面子 3 |4|s |s 





= ”7 
(15) 请 问 您 对 蒋 层 位 宅 的 看 法 ? A 
(16) ~ 

l 理 最 资料 














(17) 记录 被 访 者 的 性 别 





男 1 女 … 2 
(18) 请 问 您 的 年 龄 ? 岁 
(19) 请 问 您 的 最 高 学 历 ? 
小 学 及 以 下 … … 1 ”全 日 制 大 专 … “5 
和 初中 … 2 全 日 制 本 科 … 6 
成 人 教育 大 专 / 本 科 “4 
(20) 请 问 您 的 职业 状况 ? 
公务 员 ( 含 公检法 工作 人 员 ) pl 


事业 单位 非 专业 技术 类 工作 者 
企业 管理 人 员 / 职 业经 理 / 厂 长 ……… 
企业 股东 /老板 

专业 技术 人 员 / 医 生 /教师 








an 










个 体 工商 业者 
自由 职业 者 …… 
其 他 (请 注 明 ) 
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(21) 如 果 您 有 工作 单位 ， 请 问 您 的 工作 单位 性 质 为 ? 



























党 政 团 机 关 ， 1 股份 制 经 济 
科研 /教育 /医疗 和 和 事业 单位 。 2 三 资 企 业 
en 3 私营 经 济 
0 4 个 体 经 济 
集体 经 5 其 他 (请 注 明 ) 
人 
未 婚 已 婚 有 和 孩子 … 3 
已 婚 没 孩子 ， 区 离 蜡 /丧偶 “4 
(23) 请 问 您 家 常住 的 有 几 位 ? 人 ? 
(24) 请 问 您 个 人 的 年 总 收入 为 ?【 我 这 里 指 包 括 奖金 、 于 全 生 了 涉 在 站 的 育 各 各 各 的 收入 
4 万 元 以 下 10 万 一 15 万 刑 
4 万 一 6 万 元 15 万 ~20 元 元 . 
6 万 一 8 万 元 20 万 元 以 二 7 
8 万 一 10 万 元 ) 六 二 
(25) 请 问 您 的 家 庭 年 总 站 入 为 ? 【我 这 里 指 包括 奖金 津贴 优生 理 在 内 的 各 种 各 桂 风 改作 
6 万 元 以 下 ee 1x NF ~15 万 元 .4 
6 万 一 8 万 元 、》15 万 一 20 万 元 “5 
8 万 一 10 万 元 3 20 万 元 以 上 “6 
(26) 请 问 您 现在 的 居住 地 点 是 ? 、 、 ve 
区 江汉 





(27) 请 问 您 现在 的 住房 面积 ?> 
(28) 请 问 您 现在 居住 的 户型 站 构 是 ? 


平方 米 



































A 
CS 全 | I 六 | 厅 卫 
访问 结束 ， 非 常 感谢 您 的 合作 ! 
三 、 天 津 市 河西 区 某 房地产 市 场 的 统计 调查 报告 回回 
由 于 篇 幅 所 限 ， 只 摘 选 其 中 的 一 部 分 有 
(一 ) 理想 居住 地 块 的 分 析 回 
1. 天 津 市 的 理想 居住 地 块 【拓展 知识 了 


由 于 近 几 年 天 津 市 房地产 业 的 发 展 ， 新 开发 地 块 明显 向 城市 的 东 、 南 部 发 展 ， 造 成 对 
南开 区 、 梅 江 地 区 的 地 产 认 知 升温 。 但 是 ， 市 中 心 区 的 选择 仍然 占有 比较 高 的 比例 。 从 全 
市 范围 看 ， 河 西区 的 海河 岸 边 的 吸引 力 仍然 比较 强 。 天 津 市 的 理想 居住 地 块 频 率 分 布 图 如 
图 10.2 所 示 。 

2. 河西 区 的 理想 居住 地 块 

河西 区 本 身 的 理想 居住 地 块 首 推 友谊 路 一 带 ， 其 次 是 与 友谊 路 相连 接 的 梅 江 居 住 区 
河西 区 的 海河 边 排 在 第 三 位 。 这 与 近 一 年 来 对 梅 江 居 住 区 的 大 量 宣传 有 关 。 梅 江 居 住 区 作 
为 新 兴 的 居住 区 域 ， 各 个 楼 盘 着 重 在 生活 方式 和 生活 品位 上 对 其 进行 了 大 量 的 泻 染 ， 使 梅 
江 的 房价 和 知名 度 都 保持 了 较 高 的 水 平 。 
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南开 区 

市 中 心 和 平 区 
近郊 梅 江 地 区 
河西 区 东部 

河西 区 的 海河 边 
水 上 公园 附近 
河东 区 

沿海 河 一 线 

河北 区 

其 他 


日 比例 




















图 10.2 ”天津 市 的 理想 居住 地 块 频率 分 布 图 
河西 区 海河 边 一 带 ， 在 房地产 的 开 


解放 北 路 一 带 - 
烛 发 方面 力度 历来 比较 小 ， 基 本 没有 太 大 


的 楼 畜 可 供 炒 作 。 但 是 ， 其 接近 市 中 心 
的 地 理 位 置 ， 仍然 对 高 档 房 的 消费 者 具 
有 很 强 的 吸引 力 。 河 西区 的 理想 居住 地 
四 城 省 第。 块 频率 分 布 图 如 图 10. 3 所 示 。 
3. 地 块 吸引 力 分 析 
从 被 访问 者 的 选择 分 析 ， 计 划 开 发 
地 访 顺 目的 地 块 的 吸引 力 是 比较 理想 的 。 
大 洁 路 玉带 综合 数据 的 情况 ， 可 以 相对 准确 地 分 析 
图 10.3 河西 区 的 理想 居住 地 块 频率 分 布 图 购房 消费 者 群体 对 地 块 的 看 法 。 
其 中 ， 地 块 范围 取向 (河西 区 东部 
及 海河 边 ) 超 进 \50%， 地 块 明确 取向 (河西 区 的 海河 边 ) 将 近 20%。 而 海河 沿线 取向 
(沿海 河 一 线 ) 在 10% 左 右 。 说 明 无 论 哪 一 种 描述 ， 在 房屋 消费 者 的 群体 中 都 有 一 定 的 市 
场 。 随 着 今后 海河 的 开发 与 改造 ， 这 种 居住 取向 的 群体 范围 将 逐步 扩大 。 地 块 吸引 力 的 频 
数 分 布 图 如 图 10.4 所 示 。 
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地 块 范围 取向 ”地 块 明确 取向 ”海河 沿线 取向 
图 10.4 ”地 块 吸引 力 的 频数 分 布 图 
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4. 地 块 范围 取向 的 人 员 特 点 

调查 结果 显示 ,1/4 的 人 员 具 备 大 学 以 上 学 历 ，1/4 的 家 庭 年 收入 10 万 元 以 上 ,1/4 
的 专业 人 员 (医生 、 教 师 、 技 术 人 员 )，2/3 的 现 住房 面积 在 120 平方 米 以 下 , 主要 职业 分 
布 为 专业 人 员 (27%)、 企 业 管理 人 员 (20%)、 公 司职 员 (15%)、 个 体 老板 (15%)。 

可 见 ， 此 类 地 块 的 潜在 购买 者 将 是 文化 水 平 比较 高 ， 收 入 比较 稳定 的 人 群 。 根 据 其 现 
住房 的 特点 ,将 是 以 改善 现 有 居住 环境 为 主要 购买 动因 。 

5. 描述 后 购买 可 能 性 

可 能 购买 住房 的 频数 分 布 图 如 图 10.5 i 
所 示 。 在 向 被 访问 者 描述 了 高 档 公寓 小 区 7% 4% 
的 特征 以 后 ， 要 求 对 购买 的 可 能 性 进行 判 
断 ， 其 结果 进一步 证 实 此 地 块 及 开发 目标 
的 吸引 力 。 在 调查 结果 中 ， 明 确 表 示 比 较 
有 可 能 购买 的 占 34 只 。 可 以 考虑 购买 的 占 可 以 考虑 
到 55%， 这 部 分 属于 需要 考察 相关 的 因素 。 55% A 
后 才能 决定 的 人 群 。 只 有 不 到 10 听 回答 为 图 10%5 可 能 购买 住房 的 频数 分 布 图 
不 可 能 ， 比 较 坚 决 的 则 更 少 。 当 然 ， 这 只 
是 描述 小 区 后 的 调查 结果 ， 而 未 增加 位 相 丰 拉 考虑 。 其 结果 尚 有 一 定 的 偶然 性 。 

(二 ) 价格 承受 能 力 与 付款 分 析 、 A 

.可 以 接受 的 购房 总 房价 分 2 

Eee eo 6 所 示 。 被 访 者 财 住 房 总 房价 的 预期 ， 将 直接 影 
响 购买 行为 。 根 据 调查 结果 ， 猴 简 单 平均 计算 可 楼 受 的 总 房价 为 61.9 万 元 ， 其 多 数 分 布 
在 50 万 一 60 万 元 和 有 0 万 一 70 万 元 。 这 个 价格 期 ， 有 以 往 购买 房屋 经 验 的 影响 ， 而且 

并 没有 看 到 实 i 只 能 作为 定价 捷 多 过 
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图 10.6 可 以 接受 的 购房 总 房价 分 布 图 


2. 根据 简单 平均 计算 的 总 房价 范围 
根据 简单 平均 计算 的 总 房价 范围 分 布 图 如 图 10.7 所 示 。 根 据 被 访 者 对 相关 问题 的 回 
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答 ， 可 以 推算 预期 本 住房 总 房价 的 范围 为 57.4 万 一 83.6 万 元 。 多 数 人 觉得 比较 合适 和 可 
以 接受 的 价格 范围 是 61. 9 万 一 68. 8 万 元 。 这 个 价格 预期 与 想 要 购买 的 房屋 面积 是 匹配 的 
价格 。 
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图 10.7 根据 简单 平均 计算 的 总 房价 范围 分 布 图 


3. 根据 价格 敏感 度 推 算 的 总 房价 范围 

根据 价格 敏感 度 推 算 的 总 房价 范围 分 布 图 如 图 10.8 所 示 。 根 据 价格 敏感 度 研究 方法 
推算 本 住房 总 房价 的 范围 为 58 万 一 7 习 球 元 。 最 合适 的 房屋 总 价 是 62 万 元 ， 可 以 接受 的 价 
格 是 71 万 元 。 
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图 10.8 根据 价格 敏感 度 推算 的 总 房价 范围 分 布 图 


4. 根据 价格 敏感 度 推算 的 每 平方 米 房价 范围 

根据 价格 敏感 度 推算 的 每 平方 米 房价 范围 分 布 图 如 图 10.9 所 示 。 根 据 价格 敏感 度 研 
究 方法 推算 本 高 档 公寓 每 平方 米 房 价 的 范围 是 4450 一 5400 元 。 最 合适 的 每 平方 米 房 价 房 
价 是 4750 元 ， 可 以 接 的 价格 是 5200 元 

5. 购房 的 付款 方式 意愿 

图 10. 10 是 购房 的 付款 方式 频数 分 布 图 。 购 房 者 的 付款 方式 仍然 以 按揭 为 主 , 但 是 一 
次 性 付款 的 比例 明显 高 于 购买 普通 住房 的 人 群 。 在 希望 按揭 的 人 和 群 中 ,基本 愿意 首 期 付 3 
成 款 ， 约 25 万 元 。 月 供 3000 元 能 够 负担 。 
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图 10.9 根据 价格 敏感 度 推算 的 每 平方 米 房价 范围 分 布 图 
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图 10, 18” 购房 的 付款 方式 频数 分 布 图 
天 津 市 河西 区 某 房地产 市 场 的 统计 分 析 报 告 
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论文 题目 : 天 津 市 城市 居民 住房 消费 的 实证 研究 


摘要 : 本 文 竹 抽样 调查 的 基础 上 ， 针 对 和 天津 市 目前 商品 住房 结构 不 合理 的 现状 ,采用 
多 元 统计 分 析 中 的 相关 分 析 、 因 子 分 析 和 对 应 分 析 方 法 对 天 津 市 城市 居民 的 住房 消费 问题 
进行 了 实证 分 析 。 所 得 结论 为 房地产 企业 开发 适销 对 路 的 住房 产品 提供 科学 的 参考 依据 。 
关键 词 : 改善 型 住房 ; 抽样 调查 ; 对 应 分 析 ; 因子 分 析 ; 商品 房 面积 。 


The application of multivariate statistics analysis in the urban residents housing consum- 











er in Tianjin 

Abstract : In this paper, in the face of the present situation of unreasonable commodi- 
ty housing structure we dwells on the empirical analysis of the urban resident’s housing 
consumer in Tianjin in 2005 by means of correlation analysis and factor analysis and corre- 
spondence analysis basing of multivariate statistics analysis on sampling investigation. The 
results indicate that the total family income has the most important effect on the standard 
of purchasing house. The consumers whose total family income is from 80000 to 100000 
yuan are inclined to houses from 90 to 120 square meters. The conclusion can be regarded 
as a scientific basis for housing enterprises to develop suitable housing products. 

Key words: improving house; sampling investigation; correspondence analysis; fac- 


tor analysis; housing area. 
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1. 引言 

对 房地产 开发 商 来 说 ， 随 着 天 津 市 经 济 的 增长 ， 房 地 产 行业 的 竞争 也 在 不 断 加 剧 ， 开 
发 商 要 想 在 竞争 中 制胜 ， 必 然 需要 充分 的 信息 支持 和 准确 的 市 场 判 断 。 因 此 ， 对 各 个 房 地 
产 开 发 企业 提出 了 新 的 挑战 ， 即 企业 要 提高 市 场 竞争 力 ， 就 必须 更 加 重视 市 场 和 客户 的 需 
求 ， 对 市 场 的 各 种 变化 需要 充分 的 信息 支持 和 准确 的 市 场 判 断 。 

然而 ， 一 些 开 发 企业 在 目前 楼 市 “ 火 ” 的 时 候 ， 育 目地 开发 ， 致 使 市 场 出 现 结构 性 的 
供不应求 和 供过于求 ， 即 低 价位 、 小 面积 户型 的 商品 房 不 好 买 或 结构 不 合理 而 高 价位 、 大 
面积 户型 的 商品 房 积 压 。 那么 ， 在 天 津 市 城市 居民 目前 收入 水 平 的 前 提 下 ,影响 消费 者 购 
房 的 主要 因素 是 什么 ? 考虑 购买 大 面积 商品 房 的 消费 者 究竟 占 多 大 比例 ， 他 们 是 哪 一 个 收 
入 群体 ? 这 些 都 是 值得 房地产 界 和 专家 学 者 研究 的 问题 。 本 文 在 实际 调研 的 基础 上 ， 用 相 
关 分 析 、 因 子 分 析 和 对 应 分 析 等 多 种 统计 分 析 方 法 ， 对 天 津 市 城 带 居民 目前 的 住房 消费 问 
题 进行 了 实证 分 析 ， 所 得 结论 对 房地产 开发 企业 具有 一 定 的 参考 价 委 

本 文 研究 主要 针对 改善 型 住房 购买 群体 以 及 潜在 购买 狐 渍 采用 问卷 调查 进行 和 据 的 
收集 工作 ， 总 共 回收 有 效 问卷 101 份 。 调查 对 象 为 在 从 业 工 作 的 具有 稳定 收入 的 职业 
者 ， 产生 年 肯 在 80 涉 天 下 ， 家 庭 年 总 收入 水 平 起 述 站 万 元 。 

2. 个 人 特征 因素 与 消费 者 购房 面积 的 相关 分 析 

在 影响 住房 消费 的 诸多 个 人 特征 因素 中 履 叫 一 个 因素 对 购房 面积 的 选择 影响 最 大 ? 为 
此 ， 我 们 进行 了 相关 分 析 。 通过 计算 Dean 简单 相关 系数 ， 来 度量 它们 之 间 的 线性 相关 
关系 。 调用 SPSS 统计 分 析 软 件 吊 的 相 关 分 析 过 程 ， 得 到 计算 结果 ( 表 10 - 3)。 


表 10-3 简单 相关 系数 和 阵 (Tab. 10 -3 A correlation matrix) 














区 | 山 婚姻 家 | 工作 单 | ”职业 最 高 
特征 因素 一 py 年 龄 性 别 
Re 人 口 | 庭 状 况 性 质 | 状况 学 历 
中 
相关 系数 07566 一 0.002 0. 079 | 0.379 0.020 0. 261 = 608 | = 
概率 P 值 | 0.001 0. 987 0. 431 | 0. 003 0. 843 0. 108 0. 303 0. 245 


























由 表 10 -3 可 知 ， 居 民 购 房 面积 的 选择 与 家 庭 年 总 收入 、 工 作 单位 性 质 间 的 简单 相关 
系数 分 别 为 0.566 和 0. 379， 它 们 的 相关 系数 检验 的 概率 PP 值 都 近似 为 0。 因 此 ， 当 显著 
性 水 平 a 为 0.05 或 0.01 时 ， 都 应 拒绝 相关 系数 的 零 假设 ,认为 两 总 体 存 在 显著 的 线性 关 
系 。 也 就 是 说 ， 在 购房 消费 者 的 诸多 个 人 特征 因素 中 ， 家 庭 年 总 收入 对 消费 者 购房 面积 的 
选择 起 了 显著 的 影响 作用 ,其 次 是 工作 单位 性 质 。 此 外 ,学 历 对 购房 面积 也 有 一 定 的 影 
响 ， 而 常住 人 口 和 婚姻 家 庭 状况 对 消费 者 购房 面积 的 选择 却 影响 不 大 。 

3. 家 庭 年 总 收入 与 购房 面积 的 对 应 分 析 

1) 变量 的 分 类 

对 应 分 析 是 以 两 个 变量 的 交叉 列 联 表 为 研究 对 象 ， 通过 图 形 的 方式 ， 直 观 揭示 变量 不 同类 
别 之 间 的 联系 。 这 里 ， 我 们 选择 家 庭 年 总 收入 为 行 变 量 (用 入 表示 )， 分 类 值 在 1 一 6 之 间 ， 有 具 
体 分 类 如 下 ; XI 一 6 万 元 以 下 ，Xz 一 6 万 一 8 万 元 ，Xs 一 8 万 一 10 万 元 ，X4 一 10 万 一 15 万 元 ， 
Xi 一 15 万 一 20 万 元 ，X6 一 20 万 元 以 上 。 计 划 购 房 面 积 为 列 变量 (用 YY 表示 )， 分 类 值 在 1 一 9 
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之 间 ， 具 体 分 类 如 下 : Yi 一 80m? 以 下 ， 史 一 80 一 90m2 ，Y3 一 90 一 100m2 ， 到 一 100 一 120m2 ， 
Yi—120~140m: ,Ys—140~160m? ， 玫 一 160 一 180m2 ， 丈 一 180 一 200m2 ,Ys 一 200nY 以 上。 
2) 计算 结果 输出 与 解释 
调用 SPSS 统计 分 析 软 件 中 的 对 应 分 析 过 程 ， 得 到 以 下 主要 分 析 结 果 。 
(1) 对 行 、 列 变量 各 分 类 的 降 维 处 理 。 
总 体 方差 解释 如 表 10 -4 所 示 。 


表 10-4 总 体 方差 解释 (Tab. 10 -4 Total variance explained) 
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序号 特征 值 卡 方 检验 值 显著 性 概率 方差 贡献 率 累计 方差 贡献 率 
1 0.197 0.522 0. 522 
2 0. 108 0. 0 0. 810 
8 0.067 SS RS 0. 986 
4 0. 005 NS ol 4 1.000 
/ 
合计 0.377 38. 098 .000 \S ES 1. 000 1. 000 




















到 10 -4 表明 了 失 取 的 公 居于 角 杰 及 有 家 变量 的 程度 。 由 表 10 -4 可 知 ， 前 两 个 特 
ee 滑 胃 两 个 公 因子 已 能 解释 各 类 别 差异 的 主要 信息 。 
其 中 的 第 一 公 因子 占 52.2%， 第 二 从 因子 占 28.8%。 另 ， 4 对 交叉 列 联 表 做 卡 方 检验 的 
卡 方 观测 值 为 39. 098， 相应 的 概 音 为 0.000， 如 和 平 a 为 0.05， 说 明 行 变量 
(家 庭 年 总 收入 ) 与 列 变 量 - 风度 硬 起 之 间 海 旺 敌 的 相关 关系 。 行 变量 各 分 类 的 因 























子 载荷 如 表 10 - 5 所 示人 人 
表 10-5 行 变量 各 分 类 的 因子 载 答 VE 10 -5 Overview row score in dimension) 
家 庭 年 总 收 x 2 | x xs x 
行 变量 各 类 别 a 
be .455 .248 .099 .079 “19 
的 百分比 
Ai 一 = .148 —. 945 2. 031 一 .351 
As 一 .456 —. 826 .342 .412 一 .586 
特征 值 一 : 043 071 052 156 056 
L be 089 034 .756 929 116 
解释 
3 733 788 .073 028 240 
程度 
合计 822 822 .829 957 356 























表 10-5 表 明了 行 变 量 各 分 类 的 因子 载荷 。 从 行 变量 各 类 别 的 百分比 来 看 ， 在 101 名 
消费 者 中 ，X? (家 庭 年 收入 在 6 万 一 8 万 元 ) 仍 占 第 一 位 ， 占 家 庭 总 数 的 45.5 冯 ,但 从 两 
个 公 因子 贡献 之 和 与 变量 对 特征 值 的 贡献 来 看 ，X5 (家 庭 年 收入 在 15 万 一 20 万 元 ) 的 值 
最 大 ， 这 说 明 ， 15 万 一 20 万 元 年 收入 的 家 庭 对 两 个 公 因 子 的 贡献 最 大 ,在 全 部 家 庭 中 占 
有 非常 重要 的 地 位 。 
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表 10-5 中 的 第 三 、 四 行列 出 了 行 变量 各 分 类 在 第 一 、 第 二 个 公 因子 上 的 因子 载荷 ， 
它们 将 成 为 分 布 图 中 数据 点 的 坐标 。 第 六 、 七 行 是 第 一 、 第 二 个 公 因 子 分 别 对 行 变量 各 分 
类 差异 的 解释 程度 ， 如 对 Xa (8 万 一 10 万 元 ) 类 ， 公 因子 Al 解释 了 3.4% 的 差异 ， 公 因 
子 As 解 释 了 78.8% 的 差异 。 列 变量 各 分 类 的 因子 载荷 如 表 10 一 6 所 示 。 


表 10-6 列 变量 各 分 类 的 因子 载荷 (Tab. 10 - 6 Overview column score in dimension) 



































计划 购买 
Yi Ya Ys Ys Ys Ye Y7 Ys Ys 
面积 
列 变量 各 类 别 的 
i = .050 .099 .198 .158 .297 .109 .040 .050 
百分比 关 
| 
B re 
1 ef S44 | =346 .078 一 :670: 有 7 .669 2. 134 一 . 608 
< 
了 > 和 .536 195 | 一: 955 一 .392 1.318 | 一 1.507 
特征 值 .018 .010 .033 Ss7 .051 .033 .107 .069 
1 a 
解释 > 一 
程度 - 
台 计 一 























表 10-6 表 明了 列 变量 节庆 你 后 四 子 各 和 nt 在 101 名 
消费 者 中 ，Y6 (购房 面积 在 140 一 160m2 ) 占 第 1 占 家 庭 总 数 的 29.7%; Y4 (购房 面 
积 在 100 一 120m2)< 加 第 二 位 ， 占 总 家 庭 PAN Y; (购房 面积 在 120 一 140m2) 占 第 三 
位 ， eh 两 个 公 因子 在 Y》、Ys 、Ys 上 的 贡献 率 都 较 大 ， 但 Y5 的 特征 什 
最 大 ， 说 明 Y5 人 飞 购房 面积 在 120 一 140 m2) 在 消费 者 购房 中 占 的 地 位 非常 重要 。 也 就 是 
说 ， 房 地 产 开发 企业 应 重视 120 一 140m? 户型 的 开发 。 
i 表 10-6 中 的 第 三 、 四 行列 出 了 列 变 
让 量 各 分 类 在 第 一 、 第 二 个 公 因 子 上 的 因子 
2 ox, 载荷 ,它们 将 成 为 分 布 图 中 数据 点 的 坐标 。 
bX oy, Xso 第 六 、 七 行 是 第 一 、 第 二 个 公 因子 分 别 对 
中 列 变量 各 分 类 差异 的 解释 程度 ， 如 对 Ys 
本 (购房 面积 140 一 160m2) 类 ， 公 因子 Bi 解 
释 了 85.7% 的 差异 公 因 子 Bs 解释 了 
IL 11.0% 的 差异 。 
(2) 绘制 行 、 列 变量 分 类 的 对 应 分 
布 图 。 
下 让 ， 图 10.11 是 对 应 分 析 的 一 个 最 主要 统 
Dim 1 计 结果 ， 形 象 地 把 行 变量 和 列 变量 类 别 分 
图 10.11 家 庭 年 收入 与 购房 面积 的 对 应 分 布 图 ” 值 分 布 用 坐标 图 示 表 示 出 来 。 空 心 圆圈 表 











Dim 2 
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示 家 庭 年 总 收入 类 别 间 的 差异 ， 实 心 圆 图 表示 购房 面积 类 别 间 的 差异 ; 同时 也 更 直观 地 把 
家 庭 年 收入 与 购房 面积 这 两 个 变量 之 间 的 类 别 联系 形象 地 表现 出 来 。 
从 图 10. 11 可 以 看 出 ， 家 庭 年 收入 在 8 万 一 10 万 元 的 消费 者 较 偏爱 90 一 100m2 和 100 
一 120m2z 的 户型 ， 家庭 年 收入 在 10 万 一 15 万 元 的 消费 者 较 偏 爱 120 一 140m2 、140 一 160mz 
和 160 一 180m2? 的 户型 ， 其余 家 庭 收 入 类 别 对 购房 面积 的 选择 差异 不 十 分 显著 。 
4. 消费 者 购房 时 考虑 的 主要 因素 分 析 
在 消费 者 购房 时 考虑 的 诸多 因素 (如 地 段 、 房 型、 环境 、 户 型 、 面 积 、 档 次 ) 中 ， 商 
品 房 面积 的 大 小 是 否 是 消费 者 考虑 的 主要 因素 。 为 此 ,我 们 进行 了 因子 分 析 。 
1) 指标 的 选择 
因子 分 析 是 通过 研究 指标 体系 的 内 在 结构 关系 ， a te 
互 独立 但 能 包括 大 部 分 信息 的 综合 指标 ( 即 公共 因子 )。 我 们 选择 了 30 项 指标 ， 
构成 了 影响 消费 者 购房 的 指标 体系 〈 表 10 -7)。 各 个 指标 可 能 值 的 量化 结果 为 根本 
不 同意 一 1、 不 同意 一 2、 有 些 不 同意 一 3、 有 些 同意 一 ee 非常 同意 一 6。 


表 10-7 指标 体系 (Tab. IAA GE 








本 我 购买 房子 首先 考虑 地 段 (Z) Ny 住 在 郊区 (Zs) ; 我 喜欢 住 在 市 中 心 (Zs); 只 

弛 展 指 检 要 交通 方便 住 哪 里 都 可 以 ca 房子 很 少 考虑 地 段 (Zs;) 
Is (Za 天 站 我 购房 的 首要 因素 〈Z; );， 我 不 
房型 指标 | 喜欢 高 档 公寓 ， 一 艇 从 帘 就 行 Zs) ; 我 买房 不 简 地 段 ， 只 要 房型 好 就 行 (Zi ); 房型 全 

适 ， 面 积 小 -这 也 无 所 请 (ZN) 区 
< > 

区 赂 谤 应 该 有 比较 好 的 娱 有 迁 动 、 休 闲 场所 (Zi )， 小 区 内 部 的 停车 位 要 充足 
环境 指标 OY 小 区 的 空地 要 随时 能 看 到 绿地 (Z43); 高 档 会 所 是 高 档 小 区 必 不 可 少 的 设施 


(Zu) 小 区 要 有 室内 游泳 池 (2Z1; ) 





户型 只 要 合理 ， 贵 一 点 也 无 所 谓 (Z1s ) 户型 无 所 谓 ， 只 要 面积 大 就 行 (Z1; ); 我 买房 
户型 指标 | 最 先 考虑 户型 (Zis ) 我 喜欢 超 高 层 房子 的 远景 观 〈Zi ) 我 喜欢 所 有 的 房子 在 同一 层 上 
(Z20) 





我 买房 ， 先 考虑 好 面积 再 看 房型 (Zz ); 房子 越 大 越 好 (Zzs ); 我 不 喜欢 太 大 的 房子 


ee (Zs3) 面积 小 一 点 无 所 谓 ， 功 能 要 齐全 (Zs) 我 买房 时 房屋 总 价格 对 我 很 重要 (Zs ) 





我 喜欢 精装 修 的 房子 (Zzs ); 如 果 能 力 的 话 , 我 会 买 最 好 的 房子 (Zz7 ); 我 不 喜欢 太 
档次 指标 | 好 的 房子 ,那样 太 招 播 (Zzs ); 住房 好 坏 没 什么 ， 只 要 够 住 就 行 (Zzs。); 住房 档次 高 在 
朋友 面前 才 有 面子 (Zao) 








2) 计算 结果 输出 与 解释 
调用 SPSS 统计 分 析 软 件 的 因子 分 析 功 能 .得 到 计算 结果 ( 表 10 -8 和 表 10-9)。 
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表 10-8 旋转 后 的 总 体 方差 解释 (Tab. 10 -8 Rotated total variance explained) 





























特 征 值 方差 贡献 率 累计 方差 贡献 率 
Fl 10. 482 33. 322 33. 322 
F2 6. 028 19. 163 52. 485 
F3 3. 955 12. 573 65. 058 
Fd 2. 212 7.032 72. 090 
F5 1. 886 5. 996 78. 056 
F6 1. 622 5. 156 83. 212 
由 表 10- 8 可知， 我 们 可 以 提取 6 个 公 因子 整合 原来 的 30 项 指标 ， 其 累计 方差 贡献 


率 达 到 83. 212%， 可 见 前 6 个 公 因 子 作为 综合 变量 损失 较 少 s - 
表 10-9 旋转 后 的 因子 载荷 矩阵 (Tab. 10-9 SN matrix) 




























































—, 8 
3 Ne Z18 .125 | .673 | .007 
74 NE Z19 .050 | .323 | .822 
75 338 | 220 |- .094 | 一 .301| .739 
Z6 —.115| Zz21,| 宇 .153 | 一 .076 | 一 .534 
27 oo 2 a .242 | .114 | .398 
Z8 ER 他 2Z23 .109 .055 .187 .089 .006 | 一 ,276 
2Z9 一 .079| 224 | .065 | .101 | 一 .092| .028 | .178 | .495 
Z10 .396 | z25 | 一 .042| .064 | 一 .007| .232 | 一 .121| .627 
Z11 | 一 .040| .298 | 一 .009| .264 .072 | 一 .257‖ 226 “71 .054 sa | = 9 = 
212 | .176 | .004 | .092 | .740 | .107 | .204 | 227 | .ol1 |—.113|—.251|—.122|—.114|—.002 
Z13 | 一 .001 | 一 .060 | 一 .046 | .609 | 一 .008| .049 Z28 .232 .050 .514 | 一 .043 | 一 . 143 | 一 . 004 
214 | 一 .310| .207 .201 .569 .049 | 一 .035‖ 229 | .040 .140 .522 | 一 .004| .059 .095 
Z15 |—.049|—.143|—.138| .513 | .017 |—.077| z30 | .248 | .066 | .458 | .212 |—.040| .174 















































由 表 10 -9 可 以 看 出 : 第 一 公 因 子 i 在 Z1 一 Z3 上 有 较 大 的 载荷 系数 ， 属于“ 地段 因 
子 ”; 第 二 公 因 子 Fs 在 Zs 一 Zio 上 有 绝对 值 较 大 的 载荷 系数 ,属于 “房型 因子 ”; 第 三 公 因 
子 在 Zz6 一 Zso 上 有 绝对 值 较 大 的 载荷 系数 ,属于 “档次 因子 ”; 第 四 公 因 子 态 在 Zi 一 
Zis 上 有 较 大 的 载荷 系数 ,属于 “环境 因子 ”; 第 五 公 因子 F; 在 Dis 一 Z2o 上 有 绝对 值 较 大 
的 载荷 系数 ， 属 于 “户型 因子 ”; 第 六 公 因 子 Fs 在 Zzi 一 Zz5 上 有 绝对 值 较 大 的 载荷 系数 ， 
属于 “面积 因子 ”。 由 表 10 -8 可 知 ， 第 一 至 第 六 公 因 子 的 方差 贡献 率 依次 是 33.322% 、 
19.163%、12.573%、7.032%、5.996%、5.156%， 这 说 明 消 费 者 在 购房 时 对 这 六 个 方 
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面 考 虑 的 程度 是 不 一 样 的 ， 依 重要 性 依次 是 四 地 段 ; 回 房型 ; 回 档次 ; 图 环境 ; 回 户型 ; 
轿 面积。 由 此 可 见 ， 商 品 房 面积 的 大 小 并 不 是 消费 者 购房 时 所 考虑 的 主要 因素 。 

S. 结论 

家 庭 年 总 收入 是 影响 天 津 市 城市 居民 购房 标准 的 最 主要 因素 。 在 具有 稳定 收入 的 消 
费 者 中 ，70 听 的 家 庭 年 收入 是 在 6 万 一 10 万 元 ， 而 家 庭 年 收入 在 8 万 一 10 万 元 的 消费 
者 ( 占 24.8%) 钟情 于 90 一 120mz 的 户型 ， 家 庭 年 收入 在 10 万 一 15 万 元 的 消费 者 〈 占 
9.9%) 才 问 津 120m2 以 上 的 大 户型 。 由 此 可 推断 ,“ 工 薪 阶 层 ” 的 消费 者 对 购买 住房 面 
积 的 需求 主要 应 以 小 户型 (90m2z 以 下 ) 为 主 。 此 外 ,消费 者 在 购房 时 ,面积 的 大 小 并 
不 是 所 考虑 的 主要 因素 ， 如 果 地 段 、 房 型 及 其 他 条 件 比 较 合 适 ， 他 们 也 可 以 选择 相对 小 
一 些 的 户型 。 该 结论 对 于 房地产 开发 商 有 针对 性 地 开发 和 推销 住房 产品 具有 重要 的 


人 人 必 
本 章 小 二 XY 





a 
— 
rp 谍 人 区。 天 民生 应 用 区 革 太 庆 ， 二 下 
样 的 考虑 ， 本 章 中 的 案例 ， 在 给 出 基本 肖 曲 信 意 后 ， 提 出 所 要 分 析 的 问题 。 在 案例 分 
析 部 分 ， pet ren 路 和 可 能 用 到 的 方法 。 通 过 本 章 的 学 习 ， 
学 生 能 够 掌握 撰写 统计 调研 报告 和 统 刘 分 析 报告 的 基本 方法 。 
字 够 掌 可 Em >4 a 
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上 实际 操作 训练 


大 作业 1: 

试 将 所 在 学 校 〈 或 单位 ) 的 某 个 现实 问题 作为 选 题 进行 一 次 抽样 调查 ， 抽 取 的 单位 不 
少 于 50 个 。 试 写 出 调查 报告 ,内 容 包 括 以 下 几 点 : 

(1) 写 出 调查 方案 。 

(2) 进行 问卷 设计 。 

(3) 用 SPSS 统计 软件 对 搜集 到 的 数据 进行 描述 性 统计 分 析 ， 包括 绘制 统计 图 表 及 数 
据 特 征 值 的 计算 。 
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大 作业 2: 

自 拟 题目 ， 用 所 学 的 一 种 (或 几 种 ) 推断 性 统计 分 析 方 法 撰写 一 篇 处 理 数据 的 论文 。 
要 求 论文 的 正文 前 要 有 中 文摘 要 和 关键 词 ， 正 文 后 要 列 出 参考 文献 ， 论 文中 所 使 用 的 数据 
资料 要 说 明 来 源 。 论 文 的 正文 主要 包含 以 下 内 容 : 

(1) 阐述 选 题 的 背景 及 目的 。 

(2) 简介 所 用 方法 的 原理 及 算法 步骤 。 

(3) 确定 指标 体系 。 

(4) 搜集 样本 数据 。 

(5) 用 SPSS 统计 分 析 软 件 进行 计算 。 




















(6) 对 计算 输出 结果 进行 分 析 和 解释 。 
(7) 结论 。 ’ 
xz 
AR 
> 
SS- 
AR X 
二 XX 
-~ 人 


附录 1 常用 统计 表 


附 表 1 上 分 布 临界 值 表 pli(n) 二 te(n)) 一 c 




























































































0.025 0.01 
1 12. 7062 31. 8207 63.6574 1 
2 0. 8165 1. 8856 2. 9200 4. 3027 6. 96 9.9248 2 
3 0.7649 1. 6377 2. 3534 3. 1824 记 07 5. 8409 3 
4 0.7407 1. 5332 2. 1318 2 SSE 3.7469 4. 6041 4 
5 0.7267 1. 4759 2..0150 pe 3. 3649 4.0322 5 
6 0.7176 1. 4398 Log 2.4469 3.1427 3.7074 6 
7 0.7111 1.4149 Ka-_ 2. 3646 2. 9980 3. 4995 7 
8 0.7064 1.3968 | Ty 8965 3. 3554 8 
9 1. 8331 . 8214 3. 2498 9 
10 i .7638 2. 1693 10 
11 1. .7181 3. 1058 11 
12 四 .6810 3.0545 12 
13 6 1. 3502 1 .6503 3.0123 13 
14 0. 6924 1. 3450 1.7613 2. 1448 2. 6245 209768 14 
15 0. 6912 1. 3406 1.7531 2.1315 2. 6025 2.9467 15 
16 0. 6901 1. 3688 1.7459 2.1199 2. 5835 2. 9208 16 
17 0. 6892 1. 3334 1. 7396 2. 1098 2. 5669 2. 8982 17 
18 0.6884 1. 3304 1.7341 2. 1009 2. 5524 2. 8784 18 
19 0. 6876 1. 3277 1.7291 2. 0933 0.5395 2. 8609 19 
20 0.6870 1. 3253 1.7247 2. 0860 2. 5280 2. 8453 20 
21 0. 6846 1. 3232 1.7207 2.0796 2.5177 2. 8314 21 
22 0. 6858 1. 3212 1.7171 2. 0739 2. 5083 2. 8188 22 
23 0. 6853 1. 3195 1.7139 2.0687 2. 4999 2. 8073 23 
24 0. 6848 1. 3178 1.7109 2.0639 2. 4922 2.7969 24 
25 0. 6844 1. 3163 1. 7081 2. 0595 2. 4851 2.7874 25 
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( 续 ) 
a 
n n 
0.25 0.10 0.05 0.025 0.01 0. 005 
26 0. 6840 1. 3150 1.7056 2.0555 2. 4786 2.7787 26 
27 0. 6837 1. 3137 1.7033 2.0518 2.4727 2.7707 27 
28 0. 6834 1. 3125 1.7011 2.0484 2.4671 2.7633 28 
29 0. 6830 1. 3114 1. 6991 2. 0452 2. 4620 2.7564 29 
30 0. 6828 1. 3104 1. 6973 2. 0423 2. 4573 2.7500 30 
31 0. 6825 1. 3095 1. 6955 2.7440 31 
32 0. 6822 1. 3086 1. 6939 2.7385 32 
33 0. 6820 1. 3077 1. 6924 2.7333 33 
34 0. 6818 1. 3070 1. 6909 2.7284 34 
35 0. 6816 1. 3062 1. 6896 2.7238 35 
36 0. 6814 1.3055 2.7195 36 
37 0.6812 1. 3049 2.7154 37 
38 0. 6810 1. 30437 2. 02. 1 2.7116 38 
39 0. 6808 3036 > 2 工 2.7079 39 
40 0.6807> 全 和 SR 0211 2. 4233 2.7045 40 
41 gos TT 1. 3025 is | 2.0195 2. 4208 2.7012 41 
42 SS 1. 3020 1 2.0181 2.4185 2. 6981 42 
43 0. 6802 1. 3016 1.6811 2.0167 2. 4163 2. 6951 43 
44 0. 6801 1. 3011 1. 6802 2.0154 2.4141 2. 6923 44 
45 0. 6800 1. 3006 1. 6794 2.0141 2.4121 2. 6896 45 
附 表 2 下 分 布 临 界 值 表 p(Flm, me) 二 Fe(m ma)) 一 wx a=0.10 
Li 
| 2 3 4 5 6 8 12 24 co 
na 

1 39.86 | 49.50 | 53.59 | 55.83 | 57.24 | 58.20 | 59.44 | 60.70 | 62.00 | 63.33 
2 8.53 | 9.00 | 9.16 | 9.24 | 9.29 | 9.33 | 9.37 | 9.41 9.45 | 9.49 
3 5.54 | 5.46 | 5.39 | 534 | 5.31 5.28 | 5.25 | 5.22 | 5.18 | 5.13 
4 4.54 | 4.32 | 4.19 | 4.11 | 4.05 | 4.01 | 3.95 | 3.90 | 3.83 | 3.76 
5 06 | S78 | ‘382 | B52 3.40 | 3.34 3.27 | 3.19 | 3.10 
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a 一 0.05 ( 续 ) 
4 rk 6.94 6.59 6.39 6.20 6.16 6.04 5.91 5.77 5.63 
5 6.61 | 5.79 | 5.41 | 5.19 | 5.05 | 4.95 | 4.82 | 4.68 | 4.53 | 4.36 
6 5.99 | 5.14 | 4.76 | 4.53 | 4.39 | 4.28 | 4.15 4.00 | 3.84 | 3.67 
7 5.59 | 4.74 | 4.35 | 4.12 | 3.97 | 3.87 | 3.73 | 3.57 3.41 | 3.23 
8 5.32 | 4.46 | 4.07 | 3.84 | 3.69 | 3.58 ss 28 | 3.12 | 2.93 
9 5.12 | 4.26 86 | 3.63 | 3.48 | 3.37 ed 3.07 | 2.90 | 2.71 
10 4.96 | 4.10 | 3.71 | 3.48 | 3.33 | 3.22 i 2.91 | 2.74 | 2.54 
11 4.84 | 3.98 | 3.59 | 3.36 | 3.20 |/ RR 2.95 | 2.79 | 2.61 | 2.40 
12 4.75 | 3.88 | 3.49 | 3.26 | 3 RN 2.85 | 2.69 | 2.50 | 2.30 
13 4.67 | 3.80 | 3.41 | 3.18, 有 让 相 98 | 他 | 六 的 | 入校 | 名 总 
14 2.53 | 2.35 | 2.13 
15 2.48 | 2.29 | 2.07 
16 2.42 | 2.24 | 2.01 
17 2.38 | 2.19 | 1.96 
18 | 
19 网 二 | 1 | 88 
20 2. 2.28 | 2.08 | 1.84 
21 EE 如 怨 | 各 05 | 天 志 
22 2. S 2.23 | 2.03 | 1.78 
23 也 委 2.20 | 2.00 | 1.76 
24 4.26 | 3.40 | 3.01 | 2.78 | 2.62 | 2.51 | 2.36 | 2.18 | 1.98 | 1.73 
25 4.24 3.38 2.99 2.76 2.60 2.49 2. 34 2. 16 1.96 1.71 
26 W223 | B37 | .208 | 214 | 和 59 | 外 好 | B32 | 215 | Las | Lg 
好 4.21 | 3.35 | 2.96 | 2.73 57 | 2.46 | 2.30 | 2.13 | 1.93 | 1.67 
28 4.20 | 3.34 | 2.95 | 2.71 | 2.56 | 2.44 | 2.29 .12 | 1.91 | 1.65 
29 4.18 3. 33 2. 93 2.70 2.54 2.43 2.28 2.10 1. 90 1. 64 
30 4.17 | 3.32 | 2.92 | 2.69 53 | 2.42 | 2.27 | 2.09 | 1.89 | 1.62 
40 4.08 | 3.23 | 2.84 | 2.61 | 2.45 | 2.34 | 2.18 | 2.00 | 1.79 | 1.51 
60 4.00 | 3.15 | 2.76 | 2.52 | 2.37 | 2.25 | 2.10 | 1.92 | 1.70 | 1.39 
120 3.92 | 3.07 | 2.68 | 2.45 | 2.29 | 2.17 | 2.02 1.83 | 1.61 | 1.25 
oo 3.84 | 2.99 | 2.60 | 2.37 | 2.21 | 2.10 | 1.94 | 175 | 152 | 1.00 
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常用 统计 表 
a 一 0.025 ( 续 ) 
2 有 4 5 6 8 12 24 co 
































5. 12 4.85 
4. 42 4.14 
3.95 3.67 
3.61 3.33 
3.37 08 


























2.79 49 
2.70 40 
2. 63 32 
2. 56 2. 25 
2. 50 19 



































2. 37 04 
2. 33 00 
2. 30 E97 
2.27 1. 94 
2. 24 入 
2.22 1.88 
2. 19 1.85 
2.17 1.83 
2.15 1.81 


























4.18 3.59 3. 25 3.03 2.87 2. 65 2. 41 2. 14 1.79 
各 4.05 3.46 3.13 2.90 2.74 .53 29 2.01 1.64 
5 3.93 3.34 3.01 2.79 2.63 2.41 2.17 1.88 1.48 
5. 3. 80 3. 23 2. 89 2. 67 2.52 2. 30 2.05 1.76 1.31 
所 S69 .12 2.79 2.57 2. 41 2.19 1.94 1.64 1.00 
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a=0.01 ( 续 ) 
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常用 统计 表 
a 一 0.05 ( 续 ) 
1 2 3 4 5 6 8 12 24 co 
Ny 

1 16211 24940 | 25465 
2 198.5 199.5 | 199.5 
3 55. 55 42.62 | 41.83 
4 31. 33 20.03 | 19.32 
5 22.78 12.78 | 12.14 
6 18. 63 9.47 | 8.88 
7 16. 24 7.65 | 7.08 
8 14. 69 6.50 | 5.95 
9 13. 61 5.73 | 5.19 
10 12. 83 5.17 | 4.64 
11 12. 23 4.76 | 4.23 
12 11.75 4.43 | 3.90 
13 11.37 4.17 | 3.65 
14 11.06 3.96 | 3.44 
15 3.79 | 3.26 
16 3.64 | 3.11 
17 10. 38 3.51 | 2.98 
18 10. 22 3.40 | 2.87 
19 10.07 3.31 | 2.78 
20 9.9 3.22 | 2.69 
1 9.8 | 6.89 | 5.73 | 5.09 | 4.68 | 439 | 4.01 3.60 | 3.15 | 2.61 
22 9.73 | 6.81 5.65 | 5.02 | 4.61 4.32 | 3.94 | 3.54 | 3.08 | 2.55 
23 9.63 | 6.73 | 5.58 | 4.95 | 4.54 | 4.26 | 3.88 | 3.47 | 3.02 | 2.48 
24 9.55 | 6.66 | 5.52 | 4.89 | 4.49 | 4.20 | 3.83 | 3.42 | 2.97 | 2.43 
25 9.48 | 6.60 | 5.46 4.84 | 4.43 | 4.15 | 3.78 | 3.37 | 2.92 | 2.38 
26 9.41 | 6.54 | 5.41 | 4.79 | 4.38 | 4.10 | 3.73 | 3.33 | 2.87 | 2.33 
27 9.34 | 6.49 | 5.36 | 4.74 4. 34 4.06 | 3.69 | 3.28 | 2.83 | 2.29 
28 9.28 | 6.44 | 5.32 | 4.70 | 4.30 | 4.02 | 3.65 | 3.25 | 2.79 | 2.25 
29 9.23 | 6.40 | 5.28 | 4.66 | 4.26 | 3.98 | 3.61 3.21 2.76 | 2.21 
30 9.18 | 6.35 | 5.24 | 4.62 | 4.23 | 3.95 | 3.58 | 3.18 | 2.73 | 2.18 
40 8.83 | 6.07 | 4.98 | 4.37 | 3.99 | 3.71 | 3.35 | 2.95 | 2.50 | 1.93 
60 8.49 | 5.79 | 473 | 4.14 | 3.76 | 3.49 | 3.13 | 2.74 | 2.29 | 1.69 
120 8.18 | 5.54 | 4.50 | 3.92 | 3.55 | 3.28 | 2.93 | 2.54 | 2.09 | 1.43 
oo 7.88 | 5.30 | 4.28 | 3.72 | 3.35 | 3.09 | 2.74 | 2.36 | 1.90 | 1.00 
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一 、 总 体 和 样本 的 几 种 常用 特征 数 
1. 总 体 常 用 特征 数 

(1) 总 体 X 的 均值 : E(X)=y 
(2) 总 体 X 的 方差 : D(X)==o 

2. 样本 常用 特征 数 


QD 样本 均值 :一 了 X， 
1 一 1 


(2) 样本 方差 :只 一 二 2 (Xi 一 

i=1 pr 人 
二 、 几 种 常用 的 随机 变量 的 分 布 
1. 标准 正 态 分 布 
1) 标准 正 态 分 布 定义 


若 X~ NG or),， 则 ZN 1) 





2) 标准 正 态 分 布 上 a 分 信 真 么 部 见 附 图 D) ,2 
P(Z>2,)—@e 
“DZ -= 一 Z. ， BHR)=1—a 
2. 分 布 ) 
1) x 分 布 定义 
若 呈 一 NO0.DG 一 1.2,7， 且 各 XX; 相互 独立 , 则 x? 一 2 X 一 她 00D。 
1 一 1 


2) 入 分 布 上 a 分 位 点 x?(n)( 见 附 图 2) 
P(X: (n)>x(n))=a， 当 n 宇 45 时 , Xx: (mn) XTZ,。 








lms 
引 Za 
附 图 1 


3. 分 布 
1) 上 分 布 定义 
若 X~N(0,1), Y~x*(n), 且 久 与 Y 相 互 独立 ， 则 
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2) 分 布 上 a 分 位 点 te(Cz) 〈( 见 附 图 3) 
P(L(Cz) 志 ia()) 一 wc， 三 -CD) 一 一 上 (2) 





4. 下 分 布 
1) 下 分 布 定义 
车 X~x (mm), Y~x?(nz)， 且 久 与 Y 相互 独立 ， 则 
一 一 Foa ,nz) 
a 


oO ta(n) 





附 图 3 ,A 附 图 4 


2) 下 分 布 上 a 分 位 点 Fo (ni nz) ig 4) 


P(F(n! ,ns 2 ) 盖 玉 a ))=a,Fi— i 

二 、 几 种 常用 的 样本 统计 的 芬 布 
1, 用 于 单 总 体 均值 验 的 分 布 
设 总 体 X 一 Neo2 ) (Xi ， 2 
XP 
区 用 于 到 候 条 均值 检验 的 工分 布 “ 

设 总 体 X~ Na ,ai)，Y 一 NGCe ce)， 且 X 与 了 相互 独立 ， (XI ,Xs ,Xi) 和 
(Y1,Y2z,… ,Yn2z) 分 别 为 来 自 总 体 X 和 YY 的 样本 ， 则 
Ze N01) 








3. 用 于 单 总 体 均值 检验 的 1 分布 
设 总 体 X~N (yo?)，(Xi ,Xs,…,XX,) 为 来 自 该 总 体 的 样本 ， 则 


一 从 一 Ap 到 
1 本 
Sn 





4. 用 于 双 总 体 均 值 检验 的 上 分布 
设 总 体 X~N (jn,of), Y~N (jp,03),， 且 久 与 Y 相互 独立 ，(Xi,X2,…,Xm) 和 
(Yi1,Y2,… ,Yn2) 分 别 为 来 自 总 体 久 和 YY 的 样本 ， 则 


X—Y— (pp2) 
A ~ Fn —2) 
Se J 


nl 
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式 中 ， 


mm 十 nz 一 2 
5. 用 于 单 总 体 方差 检验 的 x? 分 布 
设 总 体外 一 兴 (n)，(X1,X。,…, 尺 ,) 为 来 自 该 总 体 的 样本 ， 则 
妃 王 (一 1)S2/o2 ~ (nO—1) 
6. 用 于 双 总 体 方差 检验 的 下 分 布 
设 总 体 X 一 NG ,oai)，Y 一 NG ,o)， 且 X 与 了 相互 独立 ， (XI Xa ,Xi) 和 
Ci ,Ya Yo2) 分 别 为 来 自 总 体 X 和 Y 的 样本 ， 则 


St/S? 
= 1/ ~Flni —1, nzs—1) 


of /og 攻 伦 





F 





